浅谈Python采集网页时正则表达式匹配换行符的问题

2019-11-25 13:37:51

字体：大中小

来源：转载

供稿：网友

如下所示：

p1 = r'(?<=<div class="ds_cr">)(.*?)(?=<div id="pageurl">)' #这样采集html时出错，采集不到数据，正则中 . 是不能匹配换行符，改成如下：p1 = r'(?<=<div class="ds_cr">)([/s/S]*?)(?=<div id="pageurl">)' # 这是我们写的正则表达式规则，你现在可以不理解啥意思

[/s/S]

匹配任何空白字符，包括空格、制表符、换页符等等。等价于[ /f/n/r/t/v]。

匹配任何非空白字符。等价于[^ /f/n/r/t/v]。

以上这篇浅谈Python采集网页时正则表达式匹配换行符的问题就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持武林网。

上一篇：Python 获取div标签中的文字实例

下一篇：Python实现正则表达式匹配任意的邮箱方法