怎么用python爬虫获取豆瓣的书评-快上网网站建设公司

怎么用python爬虫获取豆瓣的书评

小编给大家分享一下怎么用python爬虫获取豆瓣的书评，相信大部分人都还不怎么了解，因此分享这篇文章给大家参考一下，希望大家阅读完这篇文章后大有收获，下面让我们一起去了解一下吧！

我们提供的服务有：做网站、网站建设、微信公众号开发、网站优化、网站认证、番禺ssl等。为近千家企事业单位解决了网站和推广的问题。提供周到的售前咨询和贴心的售后服务，是有科学管理、有技术的番禺网站制作公司

python的五大特点是什么

python的五大特点：1.简单易学，开发程序时，专注的是解决问题,而不是搞明白语言本身。2.面向对象，与其他主要的语言如C++和Java相比, Python以一种非常强大又简单的方式实现面向对象编程。3.可移植性，Python程序无需修改就可以在各种平台上运行。4.解释性，Python语言写的程序不需要编译成二进制代码,可以直接从源代码运行程序。5.开源，Python是 FLOSS(自由/开放源码软件)之一。

1、分析网站

整个豆瓣的框架设计都是简单的静态页面，只需要页面代码参数。

urls=[]
pages=79 #可以根据页面数据来设定
for page in range(0,pages):      
    url = 'https://book.douban.com/subject/26369699/reviews?start={}'.format(page)
    urls=urls.append(url)

通过观察每个页面的网站规则，可以推测start的计算公式，例如上面的代码自动生成所有数据的地址。

2、爬取网页

需要登录并将cookie传递给请求头，以便正常请求数据。您可以在开发人员模型的RequestHeaders中获得cookies值。

def getHTML(url):
    headers={'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.114 Safari/537.36',
             'Connection': 'keep-alive',
             'Cookie': '', #你的cookies
             'Referer': 'https://book.douban.com/subject/26369699/reviews',
            }
    request = urllib.request.Request(url,headers=headers)
    response = urllib.request.urlopen(request)
    content = response.read().decode('utf-8')
    return content

以上是“怎么用python爬虫获取豆瓣的书评”这篇文章的所有内容，感谢各位的阅读！相信大家都有了一定的了解，希望分享的内容对大家有所帮助，如果还想学习更多知识，欢迎关注创新互联行业资讯频道！

当前文章：怎么用python爬虫获取豆瓣的书评
当前网址：http://cdkjz.cn/article/ipjodc.html

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

怎么用python爬虫获取豆瓣的书评

python的五大特点是什么

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

怎么用python爬虫获取豆瓣的书评

python的五大特点是什么

相关资讯

linux常用命令组 linux常用命令用法

山南抖音小程序公司 南平抖音小程序开发公司

html5语义化教学 html语义化有哪些优点

android常规尺寸 android界面尺寸

linux命令行变成》 linux如何从命令行切换到图形界面

广告屏html5 广告屏led显示屏

ios开发时区列表 苹果手机开发时间

怎么登陆微信企业邮箱 怎么登陆微信

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

山南抖音小程序公司南平抖音小程序开发公司

ios开发时区列表苹果手机开发时间

怎么登陆微信企业邮箱怎么登陆微信

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接