网站建设 >

查看其它板块

scrapy导出文件中文乱码问题-创新互联

背景：

使用scrapy crawl spidername -o filename.json命令执行爬虫，并将item写入文件，发现中文乱码，比如这样子：
scrapy导出文件中文乱码问题

创新互联公司提供网站设计制作、成都网站设计、网页设计，高端网站设计，广告投放平台等致力于企业网站建设与公司网站制作，十载的网站开发和建站经验,助力企业信息化建设，成功案例突破近1000家,是您实现网站建设的好选择.

解决方法

第一种方法：

使用scrapy命令导出时指定编码格式

scrapy crawl baidu -o baidu_med.json -s FEED_EXPORT_ENCODING=utf-8

第二种方法：

借助Pipeline将item写入到文件
1.修改pipelines.py，添加：

import json
import codecs

class YiyaoPipeline(object):
    def __init__(self):
        self.file = codecs.open('item.json', 'wb', encoding='utf-8')

    def process_item(self, item, spider):
        line = json.dumps(dict(item), ensure_ascii=False) + '\n'
        self.file.write(line)
        return item

2.修改settings.py，激活pipeline：

ITEM_PIPELINES = {
   'yiyao.pipelines.YiyaoPipeline': 300,
}

注意：settings.py默认有ITEM_PIPELINES配置，只是注销掉了。
3.使用scrapy命令导出时，直接执行：

scrapy crawl baidu

本文名称：scrapy导出文件中文乱码问题-创新互联
文章位置：http://cdkjz.cn/article/djdoep.html

返回首页了解更多建站资讯

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

大客户专线成都：13518219792 座机：028-86922220

在线咨询提交需求

友情链接交换友情链接

西部信息中心成都网站建设网络营销推广响应式报价凯亚自动化控制中国电信成都枢纽中心注册域名校园网站建设方案手机网站建设宜宾网站建设

成都网站建设公司地址：成都市青羊区太升南路288号锦天国际A座10层建设咨询028-86922220

专家团队为您提供成都网站建设,成都网站设计,成都品牌网站设计,成都营销型网站制作等服务,成都建网站就找快上网！ | 成都网站建设哪家好？ | 网站建设地图

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

scrapy导出文件中文乱码问题-创新互联

背景：

解决方法

第一种方法：

第二种方法：

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

scrapy导出文件中文乱码问题-创新互联

背景：

解决方法

第一种方法：

第二种方法：

相关资讯

oracleerp漏洞 plumelog 漏洞

关于sap财务系统需要记帐吗的信息

sharepoint中文 sharepoint automate

mysql输出怎么设置 mysql输出hello word

oracle的erp特点 oracle erp cloud

当下有哪些技术用到GIS gis技术的应用领域

vb.net透明画布 vba窗体透明效果

mysql怎么做判断时间 mysql中比较时间大小

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接