如何实现SparkExecutor内存管理-快上网网站建设公司

如何实现SparkExecutor内存管理

本篇文章为大家展示了如何实现Spark Executor内存管理，内容简明扼要并且容易理解，绝对能使你眼前一亮，通过这篇文章的详细介绍希望你能有所收获。

成都创新互联公司专注于醴陵网站建设服务及定制，我们拥有丰富的企业做网站经验。热诚为您提供醴陵营销型网站建设，醴陵网站制作、醴陵网页设计、醴陵网站官网定制、小程序定制开发服务，打造醴陵网络公司原创品牌,更为您提供醴陵网站排名全网营销落地服务。

前言

Spark 的内存管理是内存分布式引擎中的一个重要角色，了解内存管理机制和原理，才能更好地做优化。

内容

1、静态内存管理（Spark 1.6.x版本前的策略）

静态内存管理图示——堆内

如何实现Spark Executor内存管理
Unroll 的源码参考：https://github.com/apache/spark/blob/branch-1.6/core/src/main/scala/org/apache/spark/storage/MemoryStore.scala#L249

静态内存管理图示——堆外

2、统一内存管理（Spark 1.6.x以后的策略）

统一内存管理图示——堆内
如何实现Spark Executor内存管理

统一内存管理图示——堆外

其中最重要的优化在于动态占用机制，其规则如下： 1\设定基本的存储内存和执行内存区域（spark.storage.storageFraction 参数），该设定确定了双方各自拥有的空间的范围 双方的空间都不足时，则存储到硬盘；若己方空间不足而对方空余时，可借用对方的空间;（存储空间不足是指不足以放下一个完整的 Block） 2\执行内存的空间被对方占用后，可让对方将占用的部分转存到硬盘，然后"归还"借用的空间 3\存储内存的空间被对方占用后，无法让对方"归还"，因为需要考虑 Shuffle 过程中的很多因素，实现起来较为复杂

动态占用机制图示
如何实现Spark Executor内存管理

凭借统一内存管理机制，Spark 在一定程度上提高了堆内和堆外内存资源的利用率，降低了开发者维护 Spark 内存的难度，但并不意味着开发者可以高枕无忧。譬如，所以如果存储内存的 空间太大 或者说 缓存的数据 过多，反而会导致频繁的全量垃圾回收，降低任务执行时的性能，因为缓存的 RDD 数据通常都是长期驻留内存的。所以要想充分发挥 Spark 的性能，需要开发者进一步了解存储内存和执行内存各自的管理方式和实现原理。

统一内存管理还可以简化
(1)Reserved Memory

不推荐改变此参数(默认即可)；
系统保留的内存，从Spark 1.6.0开始，它的值为300MB，如果没有Spark重新编译或设置 spark.testing.reservedMemory，它的大小不能以任何方式改变，，因为它不是用于生产的测试参数。
如果没有给Spark执行程序至少 1.5 保留内存 = 450MB heap，spark-submit 将失败并显示**“please use larger heap size”*** 的错误消息。

(2)User Memory

在分配 Spark Memory之后剩余的内存池；
用户可以在那里存储将在RDD转换中使用的数据结构、Spark的元数据，所以必须在编码中注意数据结构的定义和使用；
内存池的大小可以计算为（“ Java heap ” - “reserved memory ”）（1.0 - spark.memory.fraction），默认情况下等于（“ Java堆 ” - 300MB ） 0.25

(3)Spark Memory

Apache Spark管理的内存池;
计算:（“ Java堆 ” - “保留内存 ”）* spark.memory.fraction，并且使用Spark 1.6.0默认值它给我们（“ Java堆 ” - 300MB）* 0.75。
Execution Memory 和 Storage Memory 的边界由 spark.memory.storageFraction 设置参数，默认为0.5。
Storage Memory:这个内存用于缓存以后还会用到的数据：如广播变量、persist
Execution Memory:这个内存用于存储执行Spark shuffles、joins、sorts和aggregations 期间所需的对象。

上述内容就是如何实现Spark Executor内存管理，你们学到知识或技能了吗？如果还想学到更多技能或者丰富自己的知识储备，欢迎关注创新互联行业资讯频道。

文章题目：如何实现SparkExecutor内存管理
URL链接：http://cdkjz.cn/article/jgepcj.html

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

如何实现SparkExecutor内存管理

前言

内容

1、静态内存管理（Spark 1.6.x版本前的策略）

2、统一内存管理（Spark 1.6.x以后的策略）

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

如何实现SparkExecutor内存管理

前言

内容

1、静态内存管理（Spark 1.6.x版本前的策略）

2、统一内存管理（Spark 1.6.x以后的策略）

相关资讯

mysql两个字怎么取名,取名字二个字

jquerydemo,jquery的model方法

oracle中怎么或语句,oracle的使用

javascript神书,狂神javascript笔记

go语言和语言有什么区别,go语言属于什么语言

go语言存储过程,gorm 存储过程

flutter开发论坛,flutter 论坛

利用css样式修饰表格,css做表格样式

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接