网站建设 >

查看其它板块

Spark集群部署（MasterHA）

一. 前提条件

引用

成都创新互联公司主营高密网站建设的网络公司,主营网站建设方案,app开发定制,高密h5微信小程序开发搭建,高密网站营销推广欢迎高密等地区企业咨询

Spark Standalone集群是Master-Slaves架构的集群模式，和大部分的Master-Slaves结构集群一样，存在着Master单点故障的问题。如何解决这个单点故障的问题，Spark提供了两种方案：

基于文件系统的单点恢复(Single-Node Recovery with Local File System)
基于zookeeper的Standby Masters(Standby Masters with ZooKeeper)
ZooKeeper提供了一个Leader Election机制，利用这个机制可以保证虽然集群存在多个Master，但是只有一个是Active的，其他的都是Standby。当Active的Master出现故障时，另外的一个Standby Master会被选举出来。由于集群的信息，包括Worker， Driver和Application的信息都已经持久化到文件系统，因此在切换的过程中只会影响新Job的提交，对于正在进行的Job没有任何的影响。加入ZooKeeper的集群整体架构

Zookeeper集群正常运行

二. 部署步骤

下载Spark程序压缩包

wget http://mirrors.shu.edu.cn/apache/spark/spark-2.4.0/spark-2.4.0-bin-hadoop2.7.tgz

解压缩并重命名

tar -zxvf spark-2.4.0-bin-hadoop2.7.tgz -C /opt
mv spark-2.4.0-bin-hadoop2.7 spark-2.4.0

配置环境变量
/etc/profile

export JAVA_HOME=/usr/lib/jdk1.8.0_172
export CLASSPATH=${JAVA_HOME}/jre/lib:${JAVA_HOME}/lib
export HADOOP_HOME=/opt/hadoop-2.7.6
export SPARK_HOME=/opt/spark-2.4.0
export PATH=${JAVA_HOME}/bin:$HADOOP_HOME/bin:$SPARK_HOME/bin:$PATH

修改机器名称

hostnamectl set-hostname res-spark-0001

执行命令使得环境变量生效

source /etc/profile

修改配置文件

cd /opt/spark-2.4.0/conf
cp log4j.properties.template log4j.properties
cp slaves.template slaves
cp spark-env.sh.template spark-env.sh
cp spark-defaults.conf.template spark-defaults.conf

4.1 slaves

res-spark-0003
res-spark-0004
res-spark-0005

4.2 spark-defaults.conf

spark.deploy.recoveryMode          ZOOKEEPER
spark.deploy.zookeeper.url         res-spark-0001:2181,res-spark-0002:2181,res-spark-0003:2181

spark.master                       spark://res-spark-0001:7077
spark.eventLog.enabled             true
spark.eventLog.dir                 hdfs://cluster1/spark/eventLog

spark.shuffle.service.enabled  true

4.3 spark-env.sh

export JAVA_HOME=/usr/lib/jdk1.8.0_172
export HADOOP_HOME=/opt/hadoop-2.7.6
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
export YARN_CONF_DIR=$HADOOP_HOME/etc/hadoop

export SPARK_HOME=/opt/spark-2.4.0

export SPARK_WORKER_CORES=6
export SPARK_WORKER_MEMORY=24g

4.4 log4j.properties

#
# Licensed to the Apache Software Foundation (ASF) under one or more
# contributor license agreements.  See the NOTICE file distributed with
# this work for additional information regarding copyright ownership.
# The ASF licenses this file to You under the Apache License, Version 2.0
# (the "License"); you may not use this file except in compliance with
# the License.  You may obtain a copy of the License at
#
#    http://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.
#

# Set everything to be logged to the console
log4j.rootCategory=INFO, console
log4j.appender.console=org.apache.log4j.ConsoleAppender
log4j.appender.console.target=System.err
log4j.appender.console.layout=org.apache.log4j.PatternLayout
log4j.appender.console.layout.ConversionPattern=%d{yy/MM/dd HH:mm:ss} %p %c{1}: %m%n

# Set the default spark-shell log level to WARN. When running the spark-shell, the
# log level for this class is used to overwrite the root logger's log level, so that
# the user can have different defaults for the shell and regular Spark apps.
log4j.logger.org.apache.spark.repl.Main=WARN

# Settings to quiet third party logs that are too verbose
log4j.logger.org.spark_project.jetty=WARN
log4j.logger.org.spark_project.jetty.util.component.AbstractLifeCycle=ERROR
log4j.logger.org.apache.spark.repl.SparkIMain$exprTyper=INFO
log4j.logger.org.apache.spark.repl.SparkILoop$SparkILoopInterpreter=INFO
log4j.logger.org.apache.parquet=ERROR
log4j.logger.parquet=ERROR

# SPARK-9183: Settings to avoid annoying messages when looking up nonexistent UDFs in SparkSQL with Hive support
log4j.logger.org.apache.hadoop.hive.metastore.RetryingHMSHandler=FATAL
log4j.logger.org.apache.hadoop.hive.ql.exec.FunctionRegistry=ERROR

分发spark程序以及配置文件到其他节点

scp -r /opt/spark-2.4.0 res-spark-0002:/opt
scp -r /opt/spark-2.4.0 res-spark-0003:/opt
scp -r /opt/spark-2.4.0 res-spark-0004:/opt
scp -r /opt/spark-2.4.0 res-spark-0005:/opt

修改 res-spark-0002节点的配置文件
6.1 spark-defaults.conf
```
spark.master                       spark://res-spark-0002:7077
```
启动集群

cd sbin
./start-all.sh

res-spark-0002节点

cd sbin
./start-master.sh

测试
res-spark-0001节点执行
```
./stop-master.sh
```
得到如下结果

Spark 集群部署（MasterHA）

submit app

spark-submit --master spark://res-spark-0001:7077  --driver-cores 4 --driver-memory 6g --conf spark.dynamicAllocation.enabled=true --conf spark.shuffle.service.enabled=true --class com.cloud.RuleEngine rule-engine-1.0-SNAPSHOT-jar-with-dependencies.jar

报错信息

18/12/30 08:47:41 ERROR TaskSchedulerImpl: Lost executor 3 on 172.16.0.24: Unable to create executor due to Unable to register with external shuffle server due to : Failed to connect to /172.16.0.24:7337

官网：

In standalone mode, simply start your workers with spark.shuffle.service.enabled set to true.

网页题目：Spark集群部署（MasterHA）
分享网址：http://cdkjz.cn/article/ihghcj.html

返回首页了解更多建站资讯

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

大客户专线成都：13518219792 座机：028-86922220

在线咨询提交需求

友情链接交换友情链接

网站推广成都做网站德阳服务器托管成都圣月制冷网络推广公司成都工商注册代办网站建设公司成都企业网站建设兴宏源活动板房小谭建站

成都网站建设公司地址：成都市青羊区太升南路288号锦天国际A座10层建设咨询028-86922220

专家团队为您提供成都网站建设,成都网站设计,成都品牌网站设计,成都营销型网站制作等服务,成都建网站就找快上网！ | 成都网站建设哪家好？ | 网站建设地图

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

Spark集群部署（MasterHA）

一. 前提条件

二. 部署步骤

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

Spark集群部署（MasterHA）

一. 前提条件

二. 部署步骤

相关资讯

阿里云服务器迁移到香港 阿里云中转到国外vps

linux根路径命令 linux设置根目录路径

包含vb点虐 分布式的词条

c语言函数思路 c语言函数的总结

电脑怎么启用mysql 电脑怎么启用独显

vb点虐 接口方法 vbnet ui

vb点虐 操作xml的简单介绍

新域名怎么解析到服务器 域名解析后怎么访问

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

阿里云服务器迁移到香港阿里云中转到国外vps

包含vb点虐分布式的词条

vb点虐接口方法 vbnet ui

vb点虐操作xml的简单介绍

新域名怎么解析到服务器域名解析后怎么访问

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接