ApacheSpark黑名单(Blacklist)机制介绍-快上网网站建设公司

ApacheSpark黑名单(Blacklist)机制介绍

在使用 Apache Spark 的时候，作业会以分布式的方式在不同的节点上运行;特别是当集群的规模很大时，集群的节点出现各种问题是很常见的，比如某个磁盘出现问题等。我们都知道 ApacheSpark 是一个高性能、容错的分布式计算框架，一旦它知道某个计算所在的机器出现问题(比如磁盘故障)，它会依据之前生成的 lineage 重新调度这个 Task。

创新互联建站成都企业网站建设服务，提供网站设计、成都网站建设网站开发,网站定制,建网站,网站搭建,网站设计,响应式网站设计,网页设计师打造企业风格网站,提供周到的售前咨询和贴心的售后服务。欢迎咨询做网站需要多少钱:18982081108

我们现在来考虑下下面的场景：

• 有个节点上的磁盘由于某些原因出现间歇性故障，导致某些扇区不能被读取。假设我们的 Spark 作业需要的数据正好就在这些扇区上，这将会导致这个 Task 失败。

• 这个作业的 Driver 获取到这个信息，知道 Task 失败了，所以它会重新提交这个 Task。

• Scheduler 获取这个请求之后，它会考虑到数据的本地性问题，所以很可能还是把这个 Task 分发到上述的机器，因为它并不知道上述机器的磁盘出现了问题。

• 因为这个机器的磁盘出现问题，所以这个 Task 可能一样失败。然后 Driver 重新这些操作，最终导致了 Spark 作业出现失败!

上面提到的场景其实对我们人来说可以通过某些措施来避免。但是对于 Apache Spark 2.2.0 版本之前是无法避免的，不过高兴的是，来自 Cloudera 的工程师解决了这个问题：引入了黑名单机制 Blacklist(详情可以参见SPARK-8425，具体的设计文档参见Design Doc for Blacklist Mechanism)，并且随着 Apache Spark 2.2.0 版本发布，不过目前还处于实验性阶段。

黑名单机制其实是通过维护之前出现问题的执行器(Executors)和节点(Hosts)的记录。当某个任务(Task)出现失败，那么黑名单机制将会追踪这个任务关联的执行器以及主机，并记下这些信息;当在这个节点调度任务出现失败的次数超过一定的数目(默认为2)，那么调度器将不会再将任务分发到那台节点。调度器甚至可以杀死那台机器对应的执行器，这些都可以通过相应的配置实现。

我们可以通过 Apache Spark WEB UI 界面看到执行器的状态(Status)：如果执行器处于黑名单状态，你可以在页面上看到其状态为 Blacklisted ，否则为 Active。如下图所示：

Apache Spark 黑名单(Blacklist)机制介绍

拥有了黑名单机制之后，上面场景的问题就可以很好的解决。

目前黑名单机制可以通过一系列的参数来控制，主要如下：

Apache Spark 黑名单(Blacklist)机制介绍

因为黑名单机制目前还处于实验性状态，所以上面的一些参数可能会在后面的 Spark 中有所修改。

结语

感谢您的观看，如有不足之处，欢迎批评指正。

如果有对大数据感兴趣的小伙伴或者是从事大数据的老司机可以加群：

658558542

欢迎大家交流分享，学习交流，共同进步。（里面还有大量的免费资料，帮助大家在成为大数据工程师，乃至架构师的路上披荆斩棘！）

最后祝福所有遇到瓶颈的大数据程序员们突破自己，祝福大家在往后的工作与面试中一切顺利。

网页题目：ApacheSpark黑名单(Blacklist)机制介绍
链接地址：http://cdkjz.cn/article/jepieo.html

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

ApacheSpark黑名单(Blacklist)机制介绍

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

ApacheSpark黑名单(Blacklist)机制介绍

相关资讯

php数据导出基础知识 php导出文件

帝国cms会员注册邮箱 帝国cms会员注册邮箱

php判断添加数据 php判断数据表是否存在

开源cms帝国内核 帝国cms开发api

查看执行的命令linux linux 查看命令由哪个脚本执行

阿里云升级服务器 阿里云服务器升级配置后需要重启吗

java求闰年代码 java计算闰年的公式

腾讯云服务器硬盘上限 腾讯云服务器硬盘上限怎么解决

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

帝国cms会员注册邮箱帝国cms会员注册邮箱

开源cms帝国内核帝国cms开发api

阿里云升级服务器阿里云服务器升级配置后需要重启吗

腾讯云服务器硬盘上限腾讯云服务器硬盘上限怎么解决

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接