浅谈Python采集网页时正则表达式匹配换行符的问题

今天小编就为大家分享一篇浅谈Py

来源gao!%daima.com搞$代*!码$网

thon采集网页时正则表达式匹配换行符的问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

如下所示：

 p1 = r'(?<=<div class="ds_cr">)(.*?)(?=<div id="pageurl">)' #这样采集html时出错，采集不到数据，正则中 . 是不能匹配换行符，改成如下： p1 = r'(?<=<div class="ds_cr">)([\s\S]*?)(?=<div id="pageurl">)' # 这是我们写的正则表达式规则，你现在可以不理解啥意思

[\s\S]

匹配任何空白字符，包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。

匹配任何非空白字符。等价于[^ \f\n\r\t\v]。

以上就是浅谈Python采集网页时正则表达式匹配换行符的问题的详细内容，更多请关注gaodaima搞代码网其它相关文章！

搞代码网（gaodaima.com）提供的所有资源部分来自互联网，如果有侵犯您的版权或其他权益，请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected]‍，我们会在看到邮件的第一时间内为您处理，或直接联系QQ：872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接：浅谈Python采集网页时正则表达式匹配换行符的问题

Hi，您需要填写昵称和邮箱！