网站建设 >

查看其它板块

怎么用scrapy框架构建python爬虫-创新互联

这篇文章主要介绍了怎么用scrapy框架构建python爬虫，具有一定借鉴价值，需要的朋友可以参考下。希望大家阅读完这篇文章后大有收获。下面让小编带着大家一起了解一下。

成都创新互联是一家专业提供梁山企业网站建设,专注与成都网站设计、成都网站建设、H5技术、小程序制作等业务。10年已为梁山众多企业、政府机构等服务。创新互联专业网络公司优惠进行中。

制作爬虫，总体来说分为两步：先爬再取。

也就是说，首先你要获取整个网页的所有内容，然后再取出其中对你有用的部分。

要建立一个Spider，你必须用scrapy.spider.BaseSpider创建一个子类，并确定三个强制的属性：

name：爬虫的识别名称，必须是的，在不同的爬虫中你必须定义不同的名字。
start_urls：爬取的URL列表。爬虫从这里开始抓取数据，所以，第一次下载的数据将会从这些urls开始。其他子URL将会从这些起始URL中继承性生成。
parse()：解析的方法，调用的时候传入从每一个URL传回的Response对象作为参数，负责解析并匹配抓取的数据(解析为item)，跟踪更多的URL。

创建douban_spider.py文件，保存在douban\spiders目录下。并导入我们需用的模块

怎么用scrapy框架构建python爬虫

编写主要模块：

怎么用scrapy框架构建python爬虫

然后运行一下，

怎么用scrapy框架构建python爬虫

会看到有403错误，是因为我们爬取的时候没加头部导致的：

怎么用scrapy框架构建python爬虫

我们来伪装一下，在settings.py里加上USER_AGENT：

USER_AGENT = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_8_3) AppleWebKit/536.5 
(KHTML, like Gecko) Chrome/19.0.1084.54 Safari/536.5'

再次运行，即可看到正确结果。

感谢你能够认真阅读完这篇文章，希望小编分享怎么用scrapy框架构建python爬虫内容对大家有帮助，同时也希望大家多多支持创新互联网站建设公司，，关注创新互联行业资讯频道，遇到问题就找创新互联网站建设公司，，详细的解决方法等着你来学习!

新闻标题：怎么用scrapy框架构建python爬虫-创新互联
文章URL：http://cdkjz.cn/article/dogdgd.html

返回首页了解更多建站资讯

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

大客户专线成都：13518219792 座机：028-86922220

在线咨询提交需求

友情链接交换友情链接

微信公众号开发众诚伟业成都网络营销乐山网站建设成都网站推广营销大足网站建设雅安机房托管成都广告招牌制作德阳网站运维马边网站建设

成都网站建设公司地址：成都市青羊区太升南路288号锦天国际A座10层建设咨询028-86922220

专家团队为您提供成都网站建设,成都网站设计,成都品牌网站设计,成都营销型网站制作等服务,成都建网站就找快上网！ | 成都网站建设哪家好？ | 网站建设地图

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

怎么用scrapy框架构建python爬虫-创新互联

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

怎么用scrapy框架构建python爬虫-创新互联

相关资讯

php怎么定时提交数据库 php怎么定时提交数据库文件

python函数doc python函数都有返回值吗

怎么查自己mysql版本 如何查看mysql的版本

mysql装好了怎么进入 安装mysql之后怎么进入

笔记本电脑可以写java代码吗 java用笔记本

mysql表中怎么建外键 mysql如何建立外键

java都写些什么代码 java写的程序有哪些

包含windows外的系统的词条

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

怎么查自己mysql版本如何查看mysql的版本

mysql装好了怎么进入安装mysql之后怎么进入

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接