通过百度云API接口抽取得到产品评论的观点,也掠去了很多评论中无用的内容以及符号,为后续进行文本主题挖掘或者规则的提取提供基础。
成都创新互联专注于成都网站建设、网站制作、网页设计、网站制作、网站开发。公司秉持“客户至上,用心服务”的宗旨,从客户的利益和观点出发,让客户在网络营销中找到自己的驻足之地。尊重和关怀每一位客户,用严谨的态度对待客户,用专业的服务创造价值,成为客户值得信赖的朋友,为客户解除后顾之忧。工具
1、百度云账号,申请应用接口(自然语言处理)
2、python3.5
以下是百度接口提供的说明:
我们使用到的可选值是13,kindle属于3C产品。
下面是代码示例:
from aip import AipNlp import csv import pandas as pd from pandas.core.frame import DataFrame """ 你的 APPID AK SK """ APP_ID = '********' API_KEY = '********' SECRET_KEY = '********' client = AipNlp(APP_ID, API_KEY, SECRET_KEY) # 导入评论数据文件,并找到第13列(12行)的评论内容提取出来 def output(): urls = [] with open('E:\\tb_iphone8.csv', "r") as f: reader = csv.reader(f) for row in reader: urls.append(row[12]) return urls # 通过百度云提供的API对评论观点进行提取 def commentTag(): x = output() all={} abst='' for i in range(10560): text=x[i] """ 调用评论观点抽取 """ """ 如果有可选参数 """ # 可选参数为13表示利用了3C产品的语料库 options = {} options["type"] = 13 """ 带参数调用评论观点抽取 """ result=client.commentTag(text, options) print(result) if "error_code" in result.keys(): abst+='' all['abstract'] = abst else: data = result['items'] items = data[0] abst += items['abstract'] all['abstract'] = abst return abst if __name__ == '__main__': ALL=commentTag() print(ALL)
另外有需要云服务器可以了解下创新互联scvps.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。