欢迎访问搞代码网站，推荐使用最新版火狐浏览器和Chrome浏览器访问本网站！
如果您觉得本站非常有看点，那么赶紧使用Ctrl+D 收藏搞代码吧

> 后端 > python > python编码中文乱码怎么回事

python编码中文乱码怎么回事

python 搞java代码 3年前 (2022-05-21) 43次浏览已收录 0个评论

首先明确几个概念：

字节流：以utf8/gbk等编码编码的字节流。

unicode对象：python代码中，a=u'中国', 或者a='中国'.decode()的结果。

terminal用于显示字符的编码：将一个用utf8/gbk编码的字节流通过terminal指定的编码，去查找对应的字符显示出来。

locale：linux下，Locale 是软件在运行时的语言环境, 它包括语言(Language), 地域 (Territory) 和字符集(Codeset)。一个locale的书写格式为: 语言[_地域[.字符集]]. 所以说呢，locale总是和一定的字符集相联系的。比如：zh_CN.GB2312

编码转换原则：unicode是"中介"，任何编码之间转换都需要先decode()到unicode。

学习python，尽在搞代码网！

针对python，先把结论放在前面，三点：

#coding:utf-8 #.py文件是什么编码就需要告诉python用什么编码去读取这个.py文件。

sys.stdout.encoding，默认就是locale的编码，print会用sys.stdout.encoding去encode()成字节流，交给terminal显示。所以locale需要与terminal一致，才能正确print打印出中文。

sys.setdefaultencoding(‘utf8’)，用于指定str.encode() str.decode()的默认编码，默认是ascii。

对编码字符串a，代码中可以直接写a.encode(“gbk”)，但事实上内部自动先通过defaultencoding 去decode成unicode之后再encode()的。

str(xxx)应该也是用这个去编码的。

'ascii' codec can't encode characters in position 7-8: ordinal not in range(128)print的时候出现这个错误一般可以使用这个方案去处理。

为了避免代码中到处都要去encode(“xxx”)，还有可能不同的地方写得不一样带来不一致的情况，推荐使用这个：

import sys   
reload(sys)   
sys.setdefaultencoding('utf8')

www#gaodaima.com来源[email protected]搞@^&代*@码)网搞代码

来源：搞代码网：原文地址：https://www.gaodaima.com

搞代码网（gaodaima.com）提供的所有资源部分来自互联网，如果有侵犯您的版权或其他权益，请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected]‍，我们会在看到邮件的第一时间内为您处理，或直接联系QQ：872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接：python编码中文乱码怎么回事

版权声明
本站的文章和资源来自互联网或者站长
的原创，按照 CC BY -NC -SA 3.0 CN
协议发布和共享，转载或引用本站文章
应遵循相同协议。如果有侵犯版权的资
源请尽快联系站长，我们会在24h内删
除有争议的资源。
网站驱动
- 部署在阿里云
- 由七牛云储存提供 CDN 加速
友情链接
- 搞代码
- 宝塔镇河妖
强烈推荐
- 腾讯云
- 二三四五