网站建设 >

查看其它板块

python爬虫如何爬取抖音热门音乐

这篇文章主要为大家展示了“python爬虫如何爬取抖音热门音乐”，内容简而易懂，条理清晰，希望能够帮助大家解决疑惑，下面让小编带领大家一起研究并学习一下“python爬虫如何爬取抖音热门音乐”这篇文章吧。

创新互联成立十多年来，这条路我们正越走越好，积累了技术与客户资源，形成了良好的口碑。为客户提供成都做网站、成都网站建设、网站策划、网页设计、国际域名空间、网络营销、VI设计、网站改版、漏洞修补等服务。网站是否美观、功能强大、用户体验好、性价比高、打开快等等，这些对于网站建设都非常重要，创新互联通过对建站技术性的掌握、对创意设计的研究为客户提供一站式互联网解决方案，携手广大客户，共同发展进步。

爬取抖音的热门音乐

这个就相对来说简单一点，这是代码运行的结果

python爬虫如何爬取抖音热门音乐

获取音乐的网址https://kuaiyinshi.com/hot/music/?source=dou-yin&page=1

打开该网页F12,F5刷新

python爬虫如何爬取抖音热门音乐

做义工只需要以上的数据

根据beautifulsoup去获取,直接上代码

headers = {
   'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'
}
# 保存路径
save_path = "G:\\Music\\douyin\\"
url = "https://kuaiyinshi.com/hot/music/?source=dou-yin&page=1"
# 获取响应
res = requests.get(url, headers=headers)
# 使用beautifulsoup解析
soup = BeautifulSoup(res.text, 'lxml')
# 选择标签获取最大页数
max_page = soup.select('li.page-item > a')[-2].text
# 循环请求
for page in range(int(max_page)):
   page_url = "https://kuaiyinshi.com/hot/music/?source=dou-yin&page={}".format(page + 1)
   page_res = requests.get(page_url, headers=headers)
   soup = BeautifulSoup(page_res.text, 'lxml')
   lis = soup.select('li.rankbox-item')
   singers = soup.select('div.meta')
   music_names = soup.select('h3.tit > a')
   for i in range(len(lis)):
       music_url = "http:" + lis[i].get('data-audio')
       print("歌名:" + music_names[i].text, singers[i].text, "链接:" + music_url)
       try:
           download_file(music_url,
               save_path + music_names[i].text + ' - ' + singers[i].text.replace('/', ' ') + ".mp3")
       except:
           pass
   print("第{}页完成~~~".format(page + 1))
   time.sleep(1)

将获取到的文件的url传递到下载函数中


def download_file(src, file_path):

   #   响应体工作流
   r = requests.get(src, stream=True)
   # 打开文件
   f = open(file_path, "wb")
   # for chunk in r.iter_content(chunk_size=512):
   #     if chunk:
   #         f.write(chunk)
   for data in tqdm(r.iter_content(chunk_size=512)):
       #tqdm进度条的使用,for data in tqdm(iterable)
       f.write(data)
   return file_path

接下来就是关于响应体工作流的说明

python爬虫如何爬取抖音热门音乐

默认情况下，当你进行网络请求后，响应体会立即被下载。你可以通过 stream 参数覆盖这个行为，推迟下载响应体直到访问 Response.content 属性：

tarball_url = 'https://github.com/kennethreitz/requests/tarball/master' r = requests.get(tarball_url, stream=True)

此时仅有响应头被下载下来了，连接保持打开状态，因此允许我们根据条件获取内容：

if int(r.headers['content-length']) < TOO_LONG: content = r.content ...

你可以进一步使用 Response.iter_content 和 Response.iter_lines 方法来控制工作流，或者以 Response.raw 从底层 urllib3 的 urllib3.HTTPResponse 读取。

如果你在请求中把 stream 设为 True，Requests 无法将连接释放回连接池，除非你消耗了所有的数据，或者调用了 Response.close。这样会带来连接效率低下的问题。如果你发现你在使用stream=True 的同时还在部分读取请求的 body（或者完全没有读取 body），那么你就应该考虑使用 contextlib.closing (文档)，如下所示：

from contextlib import closing with closing(requests.get('http://httpbin.org/get', stream=True)) as r: # 在此处理响应。

以上是“python爬虫如何爬取抖音热门音乐”这篇文章的所有内容，感谢各位的阅读！相信大家都有了一定的了解，希望分享的内容对大家有所帮助，如果还想学习更多知识，欢迎关注创新互联行业资讯频道！

            
            
                        

            分享名称：python爬虫如何爬取抖音热门音乐            

            标题网址：http://cdkjz.cn/article/igiehi.html


        
            返回首页
            了解更多建站资讯



    相关资讯
    
        
            
                    
                        使用linux的xauth命令修改x服务器访问授权-创新互联
                    
                

                    
                        python单元测试有什么好处-创新互联
                    
                

                    
                        如何在Pycharm中使用Python进行开发-创新互联
                    
                

                    
                        python里break如何使用-创新互联
                    
                

                    
                        joiner是什么意思superjoiner是几代团？-创新互联
                    
                

                    
                        Redis怎么获取某个大key值-创新互联
                    
                

                    
                        Java字符串替换函数replace（）用法解析-创新互联
                    
                

                    
                        python使用IP代理的方法有哪些-创新互联
                    
                
        
    


    
        
            
                多年建站经验
            
            
                多一份参考，总有益处
                 联系快上网，免费获得专属《策划方案》及报价
                
                    咨询相关问题或预约面谈，可以通过以下方式与我们联系
                     大客户专线   成都：13518219792
                          座机：028-86922220
                    
                
            
        
        
            在线咨询
            提交需求
        
    


    
        
            
                友情链接
                交换友情链接
            
            
                
                    上市集团网站建设成都网页设计成都h5建站开发合江网站建设泸州叙永网站建设成都光华电信机房西部信息服务器托管关键词优化排名网站优化公司成都装修公司                
            
        
    
    
        
            成都网站建设公司地址：成都市青羊区太升南路288号锦天国际A座10层 建设咨询028-86922220
            
                成都快上网科技有限公司-四川网站建设设计公司 | 蜀ICP备19037934号 Copyright 2020,ALL Rights Reserved cdkjz.cn | 成都网站建设 | © Copyright 2020版权所有.
            专家团队为您提供成都网站建设,成都网站设计,成都品牌网站设计,成都营销型网站制作等服务,成都建网站就找快上网！ | 成都网站建设哪家好？ | 网站建设地图

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

python爬虫如何爬取抖音热门音乐

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

python爬虫如何爬取抖音热门音乐

相关资讯

使用linux的xauth命令修改x服务器访问授权-创新互联

python单元测试有什么好处-创新互联

如何在Pycharm中使用Python进行开发-创新互联

python里break如何使用-创新互联

joiner是什么意思superjoiner是几代团？-创新互联

Redis怎么获取某个大key值-创新互联

Java字符串替换函数replace（）用法解析-创新互联

python使用IP代理的方法有哪些-创新互联

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接