• 欢迎访问搞代码网站,推荐使用最新版火狐浏览器和Chrome浏览器访问本网站!
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏搞代码吧

gb2312不是不能表示繁体中文吗?

php 搞代码 3年前 (2022-01-25) 87次浏览 已收录 0个评论
文章目录[隐藏]

查了下gb2312只能表示简体中文(6000多个汉字),而gbk是gb2312的扩展(兼容gb2312),可以表示(2万多个汉字)。

<code>    <title></title>    <meta charset="gb2312"><body>简体中文繁體中文</code>

运行上面代码的时候,发现繁體中文可以正常显示的,并不会乱码,哪里错了吗?

回复内容:

查了下gb2312只能表示简体中文(6000多个汉字),而gbk是gb2312的扩展(兼容gb2312),可以表示(2万多个汉字)。

<code>    <title></title>    <meta charset="gb2312"><body>简体中文繁體中文</code>

运行上面代码的时候,发现繁體中文可以正常显示的,并不会乱码,哪里错了吗?

在 Windows 上,GB2312 是 cp936 的别名,*本文来源gaodai#ma#com搞@代~码^网+搞代gaodaima码它是 GBK 或者 GB18030 我不太清楚了。

在其它平台,GB2312 还是真正的 GB2312,比如你在 Linux 上拿 Python 解析国内声明为 GB2312 的网页时一遇到生僻字或者繁体字就会报错了。

<code class="lang-bash">>>> print -l 简体中文 繁體中文| iconv -f utf-8 -t gb2312� ��iconv: 未知 16 处的非法输入序列>>> print -l 简体中文 繁體中文| iconv -f utf-8 -t gbk� ��</code>

前一命令在「體」字上转码出错了,后一命令成功执行。

GB 2312字符集并未包括繁体字,只有少数几个特例,这在维基百科GB 2312上有提到,所以如果严格按照GB 2312编码存储,会造成字符数据丢失。但是在Windows平台上当Locale是中国大陆时用非Unicode字符集进行汉字编码,默认会采用的是兼容GB 2312的GBK或GB 18030编码,这两个字符集都包含繁体字。

摘自 Wiki GB 2312

GB 2312 或 GB 2312-80 是中华人民共和国国家标准 简体中文字符集

不能。繁体应当是Big5.
你到浏览器里面看看,当前是什么字符集。

GB2312 GB2312


搞代码网(gaodaima.com)提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected],我们会在看到邮件的第一时间内为您处理,或直接联系QQ:872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:gb2312不是不能表示繁体中文吗?

喜欢 (0)
[搞代码]
分享 (0)
发表我的评论
取消评论

表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址