scrapy怎么追踪python爬虫的商品评价-创新互联-快上网网站建设公司

scrapy怎么追踪python爬虫的商品评价-创新互联

这篇文章主要介绍scrapy怎么追踪python爬虫的商品评价，文中介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们一定要看完！

成都创新互联专注为客户提供全方位的互联网综合服务，包含不限于网站建设、成都做网站、左云网络推广、微信小程序、左云网络营销、左云企业策划、左云品牌公关、搜索引擎seo、人物专访、企业宣传片、企业代运营等，从售前售中售后，我们都将竭诚为您服务，您的肯定，是我们大的嘉奖；成都创新互联为所有大学生创业者提供左云建站搭建服务，24小时服务热线：18982081108，官方网址：www.cdcxhl.com

创建一个测试的spider

scrapy genspider jdcomment01spider club.jd.com
scrapy list --查看一下

1.一些缺的数据信息探索

--人名

comment0 = response.xpath('//div[@id="comment-0"]')
print comment0.xpath('.//div[@class="item"]//div[@class="user"]//div[@class="u-name"]/text()').extract_first().replace("\r\n", '')

--获取所有评价

一个商品的总的评价信息可以从这个URL获取

/tupian/20230522/ProductPageService.aspx>{"SkuId":1601991,"ProductId":1601991,"Score1Count":115,"Score2Count":24,"Score3Count":77,"Score4Count":229,"Score5Count":3250,"ShowCount":311,"CommentCount":3695,"AverageScore":5,"GoodCount":3479,"GoodRate":0.942,"GoodRateShow":94,"GoodRateStyle":141,"GeneralCount":101,"GeneralRate":0.027,"GeneralRateShow":3,"GeneralRateStyle":4,"PoorCount":115,"PoorRate":0.031,"PoorRateShow":3,"PoorRateStyle":5}

具体有多少评论页 = CommentCount/30

其他的如Score1Count一星评论的有多少，AverageScore平均得分都很有用，下次再处理。

2.获取所有评论数

在第一部分的基础上修改读取多少也即可，修改jdcomment01spider.py，代码如下

# -*- coding: utf-8 -*-
import scrapy
from scrapy.spiders import Spider
from scrapy.selector import Selector
from tutorial.items import DmozItem
import urllib2
import math
import json
itemnum = '1601991'
commentpeypage = 30
class Jdcomment01spiderSpider(scrapy.Spider):
    name = "jdcomment01spider"
    allowed_domains = ["club.jd.com"]
    itemsummaryurl='/tupian/20230522/ProductPageService.aspx
    itemsummaryresponse = urllib2.urlopen(url)
    itemsummaryjson_dict = json.loads(itemsummaryresponse.read())
    commentrange = int(math.ceil(itemsummaryjson_dict.get('CommentCount'))/commentpeypage)
 
    start_urls = []
    for i in range(commentrange):
        s_url = "http://club.jd.com/review/" + itemnum + "-" + str(i) + "-0.html/",
        start_urls.append(s_url)
 
    def parse(self, response):
        sel = Selector(response)
        sites = sel.xpath('//ul/li')
        items = []
        for i in range(0, commentpeypage):
            divs = response.xpath('//div[@id="' + str(i) + '"]')
            uid = divs.xpath('.//div[@class="item"]//div[@class="user"]//div[@class="u-name"]/text()').extract_first().replace("\r\n", '')
            for zz in divs.xpath('.//dl'):
                item = DmozItem()
                item['prodid'] = itemnum
                item['userid'] = 'userid'
                item['type'] = zz.xpath('.//dt/text()').extract_first().replace("\r\n", '')
                item['desc'] = zz.xpath('.//dd/text()').extract_first().replace("\r\n", '')
                items.append(item)
        return item

检查结果

scrapy crawl jdcomment01spider -o items.json -t csv

以上是“scrapy怎么追踪python爬虫的商品评价”这篇文章的所有内容，感谢各位的阅读！希望分享的内容对大家有帮助，更多相关知识，欢迎关注创新互联行业资讯频道！

新闻名称：scrapy怎么追踪python爬虫的商品评价-创新互联
浏览地址：http://cdkjz.cn/article/dejegd.html

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

scrapy怎么追踪python爬虫的商品评价-创新互联

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

scrapy怎么追踪python爬虫的商品评价-创新互联

相关资讯

外汇ea设置，如何使用外汇EA有操作的步骤吗

云os设置，云OS怎么进入开发者模式

网络ip地址设置，怎样设置IP地址

win7显卡设置在哪里，win7显卡设置在哪

安卓中国织梦模板

计算机屏保密码设置，电脑怎么设置密码锁屏

百度图片搜索如何优化排名，怎么提高网站图片搜索时的排名

百度联盟如何修改用户名

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接