Spark提交的方式是什么-快上网网站建设公司

Spark提交的方式是什么

本篇内容主要讲解“Spark提交的方式是什么”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“Spark提交的方式是什么”吧!

成都创新互联主营沙湾网站建设的网络公司,主营网站建设方案,重庆APP开发,沙湾h5小程序定制开发搭建,沙湾网站营销推广欢迎沙湾等地区企业咨询

1、Spark是什么？

○ 高可伸缩性

○ 高容错

○ 基于内存计算

2、Spark的生态体系（BDAS，中文:伯利克分析栈）

○ MapReduce属于Hadoop生态体系之一，Spark则属于BDAS生态体系之一

○ Hadoop包含了MapReduce、HDFS、HBase、Hive、Zookeeper、Pig、Sqoop等

○ BDAS包含了Spark、Shark（相当于Hive）、BlinkDB、Spark Streaming（消息实时处理框架,类似Storm）等等

○ BDAS生态体系图：

Spark提交的方式是什么

3、Spark与MapReduce

优势：

○ MapReduce通常将中间结果放到HDFS上，Spark是基于内存并行大数据框架，中间结果存放到内存，对于迭代数据Spark效率高。

○ MapReduce总是消耗大量时间排序，而有些场景不需要排序，Spark可以避免不必要的排序所带来的开销

○ Spark是一张有向无环图（从一个点出发最终无法回到该点的一个拓扑），并对其进行优化。

4、Spark支持的API

Scala、Python、Java等

5、运行模式

○ Local （用于测试、开发）

○ Standlone （独立集群模式）

○ Spark on Yarn （Spark在Yarn上）

○ Spark on Mesos （Spark在Mesos）

6、运行时的Spark

Driver程序启动多个Worker，Worker从文件系统加载数据并产生RDD（即数据放到RDD中，RDD是一个数据结构），并按照不同分区Cache到内存中。如图：

Spark提交的方式是什么

8、容错Lineage

8.1、容错基本概念

○ 每个RDD都会记录自己所依赖的父RDD，一旦出现某个RDD的某些partition丢失，可以通过并行计算迅速恢复

8.2、Narrow Dependent（窄依赖）和Wide Dependent（宽依赖）

○ RDD的依赖又分为Narrow Dependent（窄依赖）和Wide Dependent（宽依赖）

○ 窄依赖：每个partition最多只能给一个RDD使用，由于没有多重依赖，所以在一个节点上可以一次性将partition处理完，且一旦数据发生丢失或者损坏可以迅速从上一个RDD恢复

○ 宽依赖：每个partition可以给多个RDD使用，由于多重依赖，只有等到所有到达节点的数据处理完毕才能进行下一步处理，一旦发生数据丢失或者损坏，则完蛋了，所以在这发生之前必须将上一次所有节点的数据进行物化（存储到磁盘上）处理，这样达到恢复。

○ 宽、窄依赖示例图：

Spark提交的方式是什么

9、缓存策略

Spark通过useDisk、useMemory、deserialized、replication4个参数组成11种缓存策略。

useDisk：使用磁盘缓存（boolean ）

useMemory：使用内存缓存（boolean）

deserialized：反序列化（序列化是为了网络将对象进行传输，boolean：true反序列化\false序列化）

replication：副本数量（int）

通过StorageLevel类的构造传参的方式进行控制,结构如下：

class StorageLevel private(useDisk : Boolean ,useMemory : Boolean ,deserialized : Boolean ,replication：Ini)

10、提交的方式

○ spark-submit（官方推荐）

○ sbt run

○ java -jar

提交时可以指定各种参数

 ./bin/spark-submit    
--class    
--master  
--deploy-mode  
--conf = 
... # other options
 
[application-arguments]

例如：

Spark提交的方式是什么

到此，相信大家对“Spark提交的方式是什么”有了更深的了解，不妨来实际操作一番吧！这里是创新互联网站，更多相关内容可以进入相关频道进行查询，关注我们，继续学习！

网页名称：Spark提交的方式是什么
URL网址：http://cdkjz.cn/article/jjeges.html

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

Spark提交的方式是什么

1、Spark是什么？

2、Spark的生态体系（BDAS，中文:伯利克分析栈）

3、Spark与MapReduce

4、Spark支持的API

5、运行模式

6、运行时的Spark

8、容错Lineage

8.1、容错基本概念

8.2、Narrow Dependent（窄依赖）和Wide Dependent（宽依赖）

9、缓存策略

10、提交的方式

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

Spark提交的方式是什么

1、Spark是什么？

2、Spark的生态体系（BDAS，中文:伯利克分析栈）

3、Spark与MapReduce

4、Spark支持的API

5、运行模式

6、运行时的Spark

8、容错Lineage

8.1、容错基本概念

8.2、Narrow Dependent（窄依赖）和Wide Dependent（宽依赖）

9、缓存策略

10、提交的方式

相关资讯

成都网站制作中开源系统建设网站与模版的区别你知道吗

昆明网站SEO优化善用大数据效果更出彩

Nginx服务器究竟是怎么执行PHP项目

小岛秀夫推特晒视频编辑画面或将亮相科隆游戏展

称杆怎么读

海外服务器机房哪家好海外服务器机房条件比较

SEO与SEM哪个工资高？SEO和SEM哪个好？

蕙质兰心是什么意思（图文）

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接