网站建设 >

查看其它板块

怎么利用Python网络爬虫获取电影天堂视频下载链接

这篇文章主要介绍“怎么利用Python网络爬虫获取电影天堂视频下载链接”，在日常操作中，相信很多人在怎么利用Python网络爬虫获取电影天堂视频下载链接问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”怎么利用Python网络爬虫获取电影天堂视频下载链接”的疑惑有所帮助！接下来，请跟着小编一起来学习吧！

成都创新互联公司成都网站建设定制制作，是成都网站维护公司,为成都PE包装袋提供网站建设服务,有成熟的网站定制合作流程，提供网站定制设计服务：原型图制作、网站创意设计、前端HTML5制作、后台程序开发等。成都网站制作热线：18982081108

【一、项目背景】

相信大家都有一种头疼的体验，要下载电影特别费劲，对吧？要一部一部的下载，而且不能直观的知道最近电影更新的状态。

今天小编以电影天堂为例，带大家更直观的去看自己喜欢的电影，并且下载下来。

怎么利用Python网络爬虫获取电影天堂视频下载链接

【二、项目准备】

首先我们第一步我们要安装一个Pycharm的软件。Pycharm软件安装可以看这篇教程：Python环境搭建—安利Python小白的Python和Pycharm安装详细教程。

电影天堂网的网址：

https://www.ygdy8.net/html/gndy/dyzz/list_23_1.html

我们需要下载几个库，怎么下载呢？首先打开Pycharm点击File再点开setting。

怎么利用Python网络爬虫获取电影天堂视频下载链接

打开后会出现这个界面点击你的项目名字（project：（你的项目名字））project interpreter点击加号下载我们需要的库本项目需要（requests，requests，time，re模块），如下图所示。

怎么利用Python网络爬虫获取电影天堂视频下载链接

如果不会加载解释器的话，可以参考这篇手把手教程：安装好Pycharm后如何配置Python解释器简易教程。

如果还缺少相应库的话，可以按照如下方式进行下载和安装。

怎么利用Python网络爬虫获取电影天堂视频下载链接

【三、项目实施】

我们需要（requests，requests，time，re模块），如下图所示。

怎么利用Python网络爬虫获取电影天堂视频下载链接

用封装方法去实现各个部分功能。首先要写一个框架：构造一个类FilmSky 然后定义一个—init方法里继承（self），再定义一个主方法（main）。最后实现这个main方法。代码如下：

怎么利用Python网络爬虫获取电影天堂视频下载链接

这个time是用于防止反爬，设置的时间延时。

首先我们来分析一下这个网址下一页得到特点。

怎么利用Python网络爬虫获取电影天堂视频下载链接

通过点击了三页我们会发现地址都是在原有的基础上“23—3，4，5”这样的变化。

我们可以用{}去代替变化的值就像这样：

https://www.ygdy8.net/html/gndy/dyzz/list_23_{}.html

这样我们在inti方法初始化url地址和构造请求头。

怎么利用Python网络爬虫获取电影天堂视频下载链接

在主方法main函数里边用for循环实现遍历网址。

怎么利用Python网络爬虫获取电影天堂视频下载链接

得到下图这样的结果：

怎么利用Python网络爬虫获取电影天堂视频下载链接

说明你已经成功一半了加油！！

现在我们需要对这些网址发生请求，为了更直观的看出来，我们用一个类写。

我们用requests发生请求这个网站的编码是gbk （怎么看网站的编码?）。

打开一个网站右键检查在header的标签，以这个网站为例，可以看到charset=“gb312”。

这个gb2312就是编码我们常见的编码方式有2种（utf_8, gbk）。

怎么利用Python网络爬虫获取电影天堂视频下载链接

怎么利用Python网络爬虫获取电影天堂视频下载链接

我们可以验证一下是不是真的请求到了。使用Print（html）看到这个结果(一个完整的html网页)说明请求成功。

怎么利用Python网络爬虫获取电影天堂视频下载链接

我们再定义这个方法（对我们的网页代码进行解析）。

我们用正则表达式来解析数据我们右键检查可以看到我们要的网站在table里面的标签的标签的标签的href。

所以我们可以先找到table，一层一层的去找，可以参考一下下面的图。

正则表达式就是(.*？)里面就是你想要得到的内容，“.*？”就是可以省略其中的标签，取到你想要地区那一层。for循环遍历得到每个网址，点击这些网址我们要对二级页面发生请求，并解析它。

因为在网页网址上的链接有一些是空的，所有这样会导致电影下载的链接不匹配。所以我们要加个判断，如果下载链接的长度大于0那么就照常显示，否则就给它一个空值，这样就不会不对应了。最后返回这个结果，如下图所示。

点开第二级页面如图右键点击下载链接，如下图所示：

我们用正则表达式解析得到我们下载链接地址，如下图所示：

看去了不是很美观，我们把链接处理一下，如下图所示：

得到结果，如下图所示：

最后我们用把数据保存在一个字典加上下载链接和电影名字：

最后我们优化一下请求的代码有点重复我们优化一下；

用一个值去保存说明请求头的内容以后请求我们只有调用这个方法进行请求就好，如下图所示：

程序运行之后可以看到效果图，如下图所示：

到此，关于“怎么利用Python网络爬虫获取电影天堂视频下载链接”的学习就结束了，希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习，快去试试吧！若想继续学习更多相关知识，请继续关注创新互联网站，小编会继续努力为大家带来更多实用的文章！

网站标题：怎么利用Python网络爬虫获取电影天堂视频下载链接
当前URL：http://cdkjz.cn/article/iisosj.html

返回首页了解更多建站资讯

相关资讯

注册国内域名都有哪些申请步骤？

云服务器使用操作方法有哪些？

中文域名网址具有哪些特点？有什么优势？

网络服务公司选择方法是怎样的？网络服务公司是做什么的？

如何创建一个推广网站？基本方法是什么

天津网站建设网站的基本流程包括几个步骤？

服务器容易被攻击应该怎么防御

建站建设需要注意哪些问题？

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

大客户专线成都：13518219792 座机：028-86922220

在线咨询提交需求

友情链接交换友情链接

电信机房托管四川國際商會四川成都网站建设成都网站设计四川电信机房托管航空文化传媒大英网站建设天泽尚品资阳发电机重庆建站

成都网站建设公司地址：成都市青羊区太升南路288号锦天国际A座10层建设咨询028-86922220

成都快上网科技有限公司-四川网站建设设计公司 | 蜀ICP备19037934号 Copyright 2020,ALL Rights Reserved cdkjz.cn | 成都网站建设 | © Copyright 2020版权所有.

专家团队为您提供成都网站建设,成都网站设计,成都品牌网站设计,成都营销型网站制作等服务,成都建网站就找快上网！ | 成都网站建设哪家好？ | 网站建设地图