在处理自然语言时123,000,000如果以标点符号分割,就会出现问题,好好的一个数字就被逗号肢解了,因此可以先下手把数字处理干净(逗号去掉)
分析
数字中经常是3个数字一组,之后跟一个逗号,因此规律为:***,***,**来源gao@!dai!ma.com搞$$代^@码!网*
正则式
代码如下:
[a-z]+,[a-z]?
代码如下:
import re
sen = “abc,123,456,789,mnp”
p = re.compile(“\d+,\d+?”)
for com in p.finditer(sen):
mm = com.group()
print “hi:”, mm
print “sen_before:”, sen
sen = sen.replace(mm, mm.replace(“,”, “”))
print “sen_back:”, sen, ‘\n’
以上就是python正则表达式去掉数字中的逗号(python正则匹配逗号)的详细内容,更多请关注gaodaima搞代码网其它相关文章!