• 欢迎访问搞代码网站,推荐使用最新版火狐浏览器和Chrome浏览器访问本网站!
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏搞代码吧

Oracle数据库字符集问题解析(2)

mysql 搞代码 4年前 (2022-01-09) 12次浏览 已收录 0个评论

欢迎进入Oracle社区论坛,与200万技术人员互动交流 >>进入 实验结果分析二 quote: ——————————————————————————– [ 更改客户端字符集为ZHS16GBK D:SET NLS_LANG=AMERICAN_AMERICA.ZHS16GBK D:SQLPLUS “

欢迎进入Oracle社区论坛,与200万技术人员互动交流 >>进入

实验结果分析二


quote:
——————————————————————————–
[ 更改客户端字符集为ZHS16GBK
D:>SET NLS_LANG=AMERICAN_AMERICA.ZHS16GBK

D:>SQLPLUS “/ AS SYSDBA”

无法正常显示数据

SQL> SELECT * FROM TEST;

R1
——————–
6+11

疑问1:ZHS16GBK为US7ASCII的超集,为什么在ZHS16GBK环境下无法正常显示


——————————————————————————–

这主要是因为Oracle检查发现数据库设置的字符集与客户端配置字符集不同,它将对数据进行字符集的转换。数据库中实际存放的数据为182(10110110)、171(10101011)、177(10110001)、177(10110001),由于数据库字符集设置为US7ASCII,它是一个7bit的字符集,存储在8bit的字节中,则Oracle忽略各字节的最高bit,则182(10110110)就变成了54(0110110),在ZHS16GBK中代表数字符号“6”(当然在其它字符集中也是“6”),同样过程也发生在其它3个字节,这样“东北”就变成了“6+11”。

实验结果分析三


quote:
——————————————————————————–
最初由 tellin 发布
用ZHS16GBK插入数据
SQL> INSERT INTO TEST VALUES(‘东北’);

1 row created.

SQL> SELECT * FROM TEST;

R1
——————–
6+11
??

SQL> EXIT

——————————————————————————–


当客户端字符集设置为ZHS16GBK后向数据库插入“东北”,Oracle检查发现数据库设置的字符集为US7ASCII与客户端不一致,需要进行转换,但字符集ZHS16GBK中的“东北”两字在US7ASCII中没有对应的字符,所以Oracle用统一的“替换字符”插入数据库,在这里为“?”,编码为63(00111111),这时,输入的信息实际上已经丢失,不管字符集设置如何改变(如下面引用的实验结果),第二行SELECT出来的结果也都是两个“?”号(注意是2个,而不是4个)。


quote:
——————————————————————————–

更改客户端字符集为US7ASCII
D:>SET NLS_LANG=AMERICAN_AMERICA.US7ASCII

D:>SQLPLUS “/ AS SYSDBA”

无法显示用ZHS16GBK插入的字符集,但可以显示用US7ASCII插入的字符集
SQL> SELECT * FROM TEST;

R1
———-
东北
??


更改服务器字符集为ZHS16GBK
SQL> update props$ set value$=’ZHS16GBK’ WHERE NAME=’NLS_CHARACTERSET’;

1 row updated.

SQL> COMMIT;

更改客户端字符集为ZHS16GBK
D:>SET NLS_LANG=AMERICAN_AMERICA.ZHS16GBK

D:>SQLPLUS “/ AS SYSDBA”

可以显示以前US7ASCII的字符集,但无法显示用ZHS16GBK插入的数据,说明用ZHS16GBK插入的数据为乱码。

SQL> SELECT * FROM TEST;

R1
——————–
东北
??

——————————————————————————–


需要指出的是,通过“update props$ set value$=’ZHS16GBK’ WHERE NAME=’NLS_CHARACTERSET’;”来修改数据库字符集是非常规作法,很可能引起问题,在这里只是原文引用网友的实验结果。

实验结果分析四


quote:
——————————————————————————–

SQL> INSERT INTO TEST VALUES(‘东北’);

1 row created.

SQL> SELECT * FROM TEST;

R1
——————–
东北
??
东北

SQL> EXIT

——————————————————————————–


由于此时数据库与客户端的字符集设置均为ZHS16GBK,所以不会发生字符集的转换,第一行与第三行数据显示正确,而第二行由于存储的数据就是63(00111111),所以显示的是“?”号。


quote:
——————————————————————————–

更改客户端字符集为US7ASCII

D:>SET NLS_LANG=AMERICAN_AMERICA.US7ASCII

D:>SQLPLUS “/ AS SYSDBA”

无法显示数据

SQL> SELECT * FROM TEST;

R1
———-
??
??
??

疑问2:第一行数据是用US7ASCII环境插入的,为何无法正常显示?

——————————————————————————–


将客户端字符集设置改为US7ASCII后进行SELECT,Oracle检查发现数据库设置的字符集为ZHS16GBK,数据需要进行字符集转换,而第一行与第三行的汉字“东”与“北”在客户端字符集US7ASCII中没有对应字符,所以转换为“替换字符”(“?”),而第二行数据在数据库中存的本来就是两个“?”号,所以虽然在客户端显示的三行都是两个“?”号,但在数据库中存储的内容却是不同的。

实验结果分析五


quote:
——————————————————————————–


SQL> INSERT INTO TEST VALUES(‘东北’);

1 row created.

SQL> EXIT
更改客户端字符集为ZHS16GBK
D:>SET NLS_LANG=AMERICAN_AMERICA.ZHS16GBK

D:>SQLPLUS “/ AS SYSDBA”

无法显示用US7ASCII插入的字符集,但可以显示用ZHS16GBK插入的字符集
SQL> SELECT * FROM TEST;

R1
——————–
东北
??
东北
6+11

SQL>
疑问3:US7ASCII为ZHS16GBK的子集,为何在US7ASCII环境下插入的数据无法显示? [/B]
——————————————————————————–


在客户端字符集设置为US7ASCII时,向字符集为ZHS16GBK的数据库中插入“东北”,需要进行字符转换,“东北”的ZHS16GBK编码为182(10110110)、171(10101011)与177(10110001)、177(10110001),由于US7ASCII为7bit编码,Oracle将这两个汉字当作四个字符,并忽略各字节的最高位,从而存入数据库的编码就变成了54(00110110)、43(00101011)与49(00110001)、49(00110001),也就是“6+11”,原始信息被改变了。这时,将客户端字符集设置为ZHS16GBK再进行SELECT,数据库中的信息不需要改变传到客户端,第一、三行由于存入的信息没有改变能显示“东北”,而第二、四行由于插入数据时信息改变,所以不能显示原有信息了。

分析了这么多的内容,但实际上总结起来也很简单,要想在字符集方面少些错误与麻烦,需要坚持两条基本原则:
在数据库端:选择需要的字符集(通过create database中的CHARACTER SET与NATIONAL CHARACTER SET子句指定);
在客户端:设置操作系统实际使用的字符集(通过环境变量NLS_LANG设置)。


例如:
CHARACTER SET ZHS16GBK
NATIONAL CHARACTER 来源gaodaimacom搞#^代%!码网SET AL16UTF16


搞代码网(gaodaima.com)提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected],我们会在看到邮件的第一时间内为您处理,或直接联系QQ:872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:Oracle数据库字符集问题解析(2)
喜欢 (0)
[搞代码]
分享 (0)
发表我的评论
取消评论

表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址