• 欢迎访问搞代码网站,推荐使用最新版火狐浏览器和Chrome浏览器访问本网站!
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏搞代码吧

python request请求乱码怎么办

python 搞java代码 3年前 (2022-05-21) 23次浏览 已收录 0个评论

POST从网页中获取数据,由于编码问题,出现乱码

方法:

```
<a href="https://www.gaodaima.com/tag/response" title="查看更多关于response的文章" target="_blank">response</a> = session.get('http://xxxx')
print(response.encoding)
response.encoding = 'utf-8'
print(response.json())
```

www#gaodaima.com来源gao@daima#com搞(%代@#码@网搞代码

原因:

1.因为数据源的编码声明不规范,导致reuqests无法判断出返回数据的正确编码,从而使用了它的默认编码 iso8859-1 来将数据转换

为 unicode,没使用正确的编码 utf-8,于是就出现乱码了。

解决办法一就是手动设置返回数据的正确编码:response.encoding = 'utf-8'。这样结果就是正确的 unicode 类型字符串。

或者将错误的 unicode 用同样的 iso8859-1 编码转换回去原本的 utf-8 编码的 str 类型字符串:data.encode('iso8859-1')。

2.(没明白,反正就这么个意思吧。编码真是个大坑!)Python中实际上有两种字符串,分别是str类型和unicode类型,这两者都是

basestring的派生类。str实际上相当于string, 而unicode则是标准的字符串,相当于wstring。

其中I/O读入的基本都是str类型,也就是说Python不关心这些字节代表什么含义。但是如果需要做真正的字符串操作的时候,建议使用

unicode类型,这样确保不存在编码问题。

JSON理论上应该可用ASCII完全表示,其中的宽字符用类似u1111的形式表达。但是现在有很多不规范的JSON出现,例如s="""{"标题": 

"Hello, world"}"""。此时就需要你自己确定这部分内容用字节表达时,究竟用了什么编码,如果是UTF-8,那么就首

s_u=s.decode("UTF-8")变成unicode字符串。

另一方面,只要保证这段字符串的编码和Python运行时环境的编码保持一致,也是可以直接loads(str类型变量)的。例如Linux下如果

LANG是UTF-8,那么python跑着的时候就可以直接把UTF-8编码的JSON串塞进去。

来源:搞代码网:原文地址:https://www.gaodaima.com


搞代码网(gaodaima.com)提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected],我们会在看到邮件的第一时间内为您处理,或直接联系QQ:872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:python request请求乱码怎么办

喜欢 (0)
[搞代码]
分享 (0)
发表我的评论
取消评论

表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址