从品牌网站建设到网络营销策划,从策略到执行的一站式服务
本文实例讲述了Python爬虫实现抓取京东店铺信息及下载图片功能。分享给大家供大家参考,具体如下:
创新互联长期为千余家客户提供的网站建设服务,团队从业经验10年,关注不同地域、不同群体,并针对不同对象提供差异化的产品和服务;打造开放共赢平台,与合作伙伴共同营造健康的互联网生态环境。为印台企业提供专业的成都网站建设、网站设计,印台网站改版等技术服务。拥有十余年丰富建站经验和众多成功案例,为您定制开发。这个是抓取信息的
from bs4 import BeautifulSoup import requests url = 'https://list.tmall.com/search_product.htm?q=%CB%AE%BA%F8+%C9%D5%CB%AE&type=p&vmarket=&spm=875.7931836%2FA.a2227oh.d100&from=mallfp..pc_1_searchbutton' response = requests.get(url) #解析网页 soup = BeautifulSoup(response.text,'lxml') #.text将解析到的网页可读 storenames = soup.select('#J_ItemList > div > div > p.productTitle > a') #选择出商店的信息 prices = soup.select('#J_ItemList > div > div > p.productPrice > em') #选择出价格的信息 sales = soup.select('#J_ItemList > div > div > p.productStatus > span > em') #选择出销售额的信息 for storename, price, sale in zip(storenames,prices,sales): storename = storename.get_text().strip() #用get_text()方法筛选出标签中的文本信息,由于筛选结果有换行符\n所以用strip()将换行符去掉 price = price.get_text() sale = sale.get_text() print('商店名:%-40s价格:%-40s销售额:%s'%(storename,price,sale)) #使打印出来的信息规范 print('----------------------------------------------------------------------------------------------')
成都网站建设公司地址:成都市青羊区太升南路288号锦天国际A座10层 建设咨询028-86922220
成都快上网科技有限公司-四川网站建设设计公司 | 蜀ICP备19037934号 Copyright 2020,ALL Rights Reserved cdkjz.cn | 成都网站建设 | © Copyright 2020版权所有.
专家团队为您提供成都网站建设,成都网站设计,成都品牌网站设计,成都营销型网站制作等服务,成都建网站就找快上网! | 成都网站建设哪家好? | 网站建设地图