Python把Spark数据写入ElasticSearch的方法-创新互联-快上网网站建设公司

Python把Spark数据写入ElasticSearch的方法-创新互联

这篇文章主要讲解了Python把Spark数据写入ElasticSearch的方法，内容清晰明了，对此有兴趣的小伙伴可以学习一下，相信大家阅读完之后会有帮助。

修武ssl适用于网站、小程序/APP、API接口等需要进行数据传输应用场景，ssl证书未来市场广阔！成为创新互联的ssl证书销售渠道，可以享受市场价格4-6折优惠！如果有意向欢迎电话联系或者加微信：18980820575（备注：SSL证书合作）期待与您的合作！

如果使用Scala或Java的话，Spark提供自带了支持写入ES的支持库，但Python不支持。所以首先你需要去这里下载依赖的ES官方开发的依赖包包。

下载完成后，放在本地目录，以下面命令方式启动pyspark:

pyspark --jars elasticsearch-hadoop-6.4.1.jar

如果你想pyspark使用Python3，请设置环境变量：

export PYSPARK_PYTHON=/usr/bin/python3
理解如何写入ES的关键是要明白，ES是一个JSON格式的数据库，它有一个必须的要求。数据格式必须采用以下格式

{ "id: { the rest of your json}}

往下会展示如何转换成这种格式。

解析Apache日志文件
我们将Apache的日志文件读入，构建Spark RDD。然后我们写一个parse()函数用正则表达式处理每条日志，提取我们需要的字

rdd = sc.textFile("/home/ubuntu/walker/apache_logs")
regex='^(\S+) (\S+) (\S+) \[([\w:/]+\s[+\-]\d{4})\] "(\S+)\s?(\S+)?\s?(\S+)?" (\d{3}|-) (\d+|-)\s?"?([^"]*)"?\s?"?([^"]*)?"?$'

p=re.compile(regex)
def parse(str):
  s=p.match(str)
  d = {}
  d['ip']=s.group(1)
  d['date']=s.group(4)
  d['operation']=s.group(5)
  d['uri']=s.group(6)
  return d

另外有需要云服务器可以了解下创新互联scvps.cn，海内外云服务器15元起步，三天无理由+7*72小时售后在线，公司持有idc许可证，提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案，具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势，专为企业上云打造定制，能够满足用户丰富、多元化的应用场景需求。

新闻名称：Python把Spark数据写入ElasticSearch的方法-创新互联
新闻来源：http://cdkjz.cn/article/ccpgid.html

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

Python把Spark数据写入ElasticSearch的方法-创新互联

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

Python把Spark数据写入ElasticSearch的方法-创新互联

相关资讯

电脑求函数平均的快捷键 电脑求平均数公式

怎么把mysql表名变大 mysql数据表改名

css设置标签的样式 css设置p标签样式

mysql怎么去掉小数 mysql去掉小数点后面的0

怎么修改mysql的库名 mysql怎么更改数据库名称

响应式布局css样式 响应式布局实现原理

mysql怎么定义百分比 mysql百分比类型

ios开发者教育账号 ios开发者账号申请一定要交钱吗

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

电脑求函数平均的快捷键电脑求平均数公式

响应式布局css样式响应式布局实现原理

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接