python3如何提取汉字

采用正则表达式的方法对字符串进行处理。

<a href="https://www.gaodaima.com/tag/str" title="查看更多关于str的文章" target="_blank">str</a>1 = "｛我%$是，《速$@.度发》中 /国、人"

www#gaodaima.com来源gaodaimacom搞#^代%!码网搞代码

相关推荐：《Python教程》

（1）提取汉字

汉字的范围为”u4e00-u9fa5“，这个是用Unicode表示的。

import re
res1 = ''.join(re.findall('[u4e00-u9fa5]',str1))
print(res1)

输出为：

‘我是速度发中国人’

（2）去除所有符号。采用清理数据，仅保留字母、数字、中文的方法。

import re
res1 = re.sub("[^a-zA-Z0-9u4e00-u9fa5]", '', str1) 
print(res1)

输出为：

‘我是速度发中国人’

来源：搞代码网：原文地址：https://www.gaodaima.com

搞代码网（gaodaima.com）提供的所有资源部分来自互联网，如果有侵犯您的版权或其他权益，请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected]‍，我们会在看到邮件的第一时间内为您处理，或直接联系QQ：872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接：python3如何提取汉字

Hi，您需要填写昵称和邮箱！