从品牌网站建设到网络营销策划,从策略到执行的一站式服务
采集列表页只要是为了获取对应内容页的链接
创新互联公司网站建设公司,提供网站建设、成都网站制作,网页设计,建网站,PHP网站建设等专业做网站服务;可快速的进行网站开发网页制作和功能扩展;专业做搜索引擎喜爱的网站,是专业的做网站团队,希望更多企业前来合作!
获取到内容页链接后 然后使用正则匹配 你要采集的信息
采集原理 可以参考(获取列表页的所有图片)
帝国cms的采集 在教程里有 需要查看对方网页的源文件 提取列表部分 内容页部分 仔细看下教程吧
添加节点:
选择要增加采集的栏目:
进入增加节点表单:
在节点名称框里起个名字,然后把要采集的新浪各地新闻列表地址copy过来:
下来发现好多选项,如“采集页面地址方式二,内容页地址前缀...”先不要理他,后面再一一详解,直接拉到 “信息链接区域正则”这里:
6
这里是设置采集的列表信息链接区域正则,我们点击查看新浪各地新闻列表“源文件”:
7
把源文件代码copy到Dreamweaver里,在Dreamweaver里选定要采集的信息链接区域:
这个要在火车头里面设置,因为你的火车头发布模块已经有了 内容简介标签,如果你要帝国cms自己提取内容简介, 那火车头里的 内容标签 就要采集内容是空的。那发上去就没有内容了,帝国cms就动提取了。 第二就是在火车头 内容标签 采集好 内容简...
成都网站建设公司地址:成都市青羊区太升南路288号锦天国际A座10层 建设咨询028-86922220
成都快上网科技有限公司-四川网站建设设计公司 | 蜀ICP备19037934号 Copyright 2020,ALL Rights Reserved cdkjz.cn | 成都网站建设 | © Copyright 2020版权所有.
专家团队为您提供成都网站建设,成都网站设计,成都品牌网站设计,成都营销型网站制作等服务,成都建网站就找快上网! | 成都网站建设哪家好? | 网站建设地图