Spark环境部署-快上网网站建设公司

Spark环境部署

==> Spark 集群体系结构

创新互联成立十年来，这条路我们正越走越好，积累了技术与客户资源，形成了良好的口碑。为客户提供做网站、网站设计、网站策划、网页设计、域名与空间、网络营销、VI设计、网站改版、漏洞修补等服务。网站是否美观、功能强大、用户体验好、性价比高、打开快等等，这些对于网站建设都非常重要，创新互联通过对建站技术性的掌握、对创意设计的研究为客户提供一站式互联网解决方案，携手广大客户，共同发展进步。

--->

==> Spark安装与部署

Spark 的安装部署有四种模式：Standalone, YARN, Mesos, Amazon EC2, 这里主要讲解Standalone 方式

---> 环境部署准备工作：（此处不作详细讲解）

---- 四台 Linux 主机（虚拟机）

---- 修改主机名

---- 免密码登陆

---- 安装 JDK 环境

---> Spark Standalone 伪分布的部署

wget  
tar zxf spark-2.2.1-bin-hadoop2.7.tgz -C /app
cd /app/spark-2.2.1-bin-hadoop2.7/conf
cp spark-env.sh.template spark-env.sh
cp slaves.template slaves
-----------------------------------------------------------------------------------
vim spark-env.sh
    export JAVA_HOME=/app/java/jdk1.8.0_102
    export SPARK_MASTER_HOST=bigdata0
    export SPARK_MASTER_PORT=7077
-----------------------------------------------------------------------------------
vim slaves
    bigdata0

---> Spark Standalone 全分布的部署

---- 环境架构：

Master	bigdata1
Worker	bigdata2	bigdata3	bigdata4

---- 主节点部署：

wget http://mirrors.hust.edu.cn/apache/spark/spark-2.2.1/spark-2.2.1-bin-hadoop2.7.tgz 
tar zxf spark-2.2.1-bin-hadoop2.7.tgz -C /app
cd /app/spark-2.2.1-bin-hadoop2.7/conf
cp spark-env.sh.template spark-env.sh
cp slaves.template slaves
-----------------------------------------------------------------------------------
vim spark-env.sh
    export JAVA_HOME=/app/java/jdk1.8.0_102
    export SPARK_MASTER_HOST=bigdata0
    export SPARK_MASTER_PORT=7077
-----------------------------------------------------------------------------------
vim slaves
    bigdata2
    bigdata3
    bigdata4

---- 将主节点的安装目录 cp 到其它从节点上即可

scp -r spark-2.2.1-bin-hadoop2.7/ bigdata2:/app &
scp -r spark-2.2.1-bin-hadoop2.7/ bigdata3:/app &
scp -r spark-2.2.1-bin-hadoop2.7/ bigdata4:/app &

---- 启动

start-all.sh

==> Spark HA 的实现

Spark HA 有两种实现方式：

---> 基于文件系统的单点故障恢复：只有一个主节点、只能用于开发测试

---- 特点：把 Spark 的运行信息入到一个本地的恢复目录，如果Master死掉，恢复 master 的时候从恢复目录上读取之前的信息

---- 配置：在 standalone 的基础上修改 spark-env.sh 文件，文件内容为：

vim  spark-env.sh
    export JAVA_HOME=/app/java/jdk1.8.0_102
    export SPARK_MASTER_HOST=bigdata0
    export SPARK_MASTER_PORT=7077
    export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=FILESYSTEM -Dspark.deploy.recoveryDirectory=/data/spark_recovery"

---- 参数讲解：

--- spark.deploy.recoveryMode

=> 此参数默认值为：None ，

=> 基于文件系统的单点故障修复: FILESYSTEM

=> 基于 Zookeeper 实现 Standby 的 Master: ZOOKEEPER

--- spark.deploy.recoveryDirectory 指定恢复目录

---- 测试：bin/spark-shell --master spark://bigdata1:7077

---> 基于 ZooKeeper 实现 Standby 的 Master

---- 特点：

Zookeeper 提供了一个 Leader Election 机制，利用这个机制可以保证虽然集群存在多个 Master，但是只有一个是Active 的，其他的都是 Standby ，当 Active 的 Master 出现故障时，另外的一个 Standby Master 会被选举出来。由于集群的信息包括 Worker, Driver 和 Application 的信息都已经持久化到 Zookeeper ，因此在切换的过程中只会影响新的 Job 的提交，对于正在进行 Job 没有任何的影响

---- 配置：在 standalone 的基础上修改 spark-env.sh 文件，文件内空为：

vim  spark-env.sh
    export JAVA_HOME=/app/java/jdk1.8.0_102
    export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=bigdata2:2181,bigdata3:2181,bigdata4:2181 -Dspark.deploy.zookeeper.dir=/spark"

---- 测试：

bigdata1: sbin/start-all.sh
bigdata2: sbin/start-master.sh

新闻标题：Spark环境部署
文章来源：http://cdkjz.cn/article/pdesio.html

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

Spark环境部署

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

Spark环境部署

相关资讯

Asp.netcore中的websocket

InnoDB:Error:spaceidandpagen:ostoredinthepage?

ssl是什么，ssl警告是什么？

如何利用百度广告管家来处理站内广告以及百度BES流量变现

Android有哪些常用工具类

Linux中的内置命令和外部命令

怎么在springboot中利用WebClient对HTTP服务进行调用

如何把Windows10的便笺按钮从操作中心挪到开始菜单和桌面

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接