老实说我并不主张网站采集,不过做为站长,网页采集实在是一大利器。拿帝国cms来说,采集功能很强大。虽然帝国CMS采集方法简单易学,但还是有朋友为采集规则而绞尽脑汁。以下是我悼念的一些帝国CMS的采集正则。
从文章的源代码中获得的
第一种:
[1] [2] [3] [4] 下一页
编写的规则:
选全部列出式
区域正则:
[!--smallpageallzz--]'>下一页
链接正则:
--------------------------------------------------------------------------------
第二种
采集代码
[1] [2] 下一页
《
编写的规则:
选用上下导航式:
分页区域正则:[!--smallpagezz--]下一页
分页链接正则:新闻正文正则:
src="http://pagead2.googlesyndication.com/pagead/show_ads.js"> [!--newstext--]
过滤广告正则:
[!--ad--] ,[!--ad--]
例如:https://www.daixiao360.cn/js/271.html
--------------------------------------------------------------------------------
第三种
【1】 【2】 【3】 【4】 【5】 
编写的规则:
"全部列出"式正则设置:
分页区域正则(无)
分页链接正则:
--------------------------------------------------------------------------------
第四种:
<< 前一页123后一页 >>
选全部列出式区域正则:
[!--smallpageallzz--]" class="nextprev" title="后一页">链接正则:
学习交流
- 绿毒越狱软件 完美越狱4.21教程12-21
- htcg15怎么刷机?htcg15刷机教程12-21
- HTC hd7刷安卓2.2全教程12-21
- mpkg软件下载和卸载的方法12-21
- 网站后台系统设置的网站地址格式写法07-09
- 防止重复提交js按钮变灰07-09
- 不同时间显示不同的广告代码07-09
- iframe框架调用高度自适应方法07-09
- 备份数据库出现问题的解决方法07-09
热门图片
猜你喜欢的新闻
新闻热点
2024-06-26 22:28:41
2024-06-26 22:26:16
2024-06-26 22:23:01
2024-06-25 19:29:23
2024-06-25 19:22:14
2024-06-25 19:19:15
疑难解答