网站建设 >

查看其它板块

Hadoop机架感知-创新互联

背景

最近在整理以前学过的大数据相关知识，今天从Hadoop的机架感知开始，Hadoop机架感知的实现有2种方式：
1）、通过实现一个Java接口DNSToSwitchMapping，然后在core-site.xml配置文件中配置net.topology.node.switch.mapping.impl，其值是实现DNSToSwitchMapping的类的全路径，例如：

目前累计服务客户近1000家，积累了丰富的产品开发及服务经验。以网站设计水平和技术实力，树立企业形象，为客户提供成都网站设计、成都网站制作、网站策划、网页设计、网络营销、VI设计、网站改版、漏洞修补等服务。创新互联始终以务实、诚信为根本，不断创新和提高建站品质，通过对领先技术的掌握、对创意设计的研究、对客户形象的视觉传递、对应用系统的结合，为客户提供更好的一站式互联网解决方案，携手广大客户，共同发展进步。


             net.topology.node.switch.mapping.impl
             com.inspur.rackawar.test.MyDNSToSwitchMapping

2）、大多数安装并不需要额外实现新的接口，只需要使用默认的ScriptBasedMapping实现即可，它运行用户定义的脚本来描述映射关系。脚本的存放路径通过core-site.xml文件中的配置项topology.script.file.name控制。只要不是非常复杂的业务，我个人推荐使用第二种方式，灵活简单。
Hadoop的分布式集群通常包含非常多的服务器，由于受到机架槽位和交换机网口的限制，通常大型的分布式集群都会跨好几个机架，由多个机架上的服务器共同组成一个分布式集群。机架内的服务器之间的网络速度通常都会高于跨机架服务器之间的网络速度，并且机架之间服务器的网络通信通常受到上层交换机间网络带宽的限制。
具体到Hadoop集群，由于hadoop的HDFS对数据文件的分布式存放是按照分块block存储，每个block会有多个副本(默认为3)，并且为了数据的安全和高效，所以hadoop默认对3个副本的存放策略为：
第一个block副本放在和client所在的node里（如果client不在集群范围内，则这第一个node是随机选取的）。
第二个副本放置在与第一个节点不同的机架中的node中（随机选择）。
第三个副本放置在与第一个副本所在节点同一机架的另一个节点上。
如果还有更多的副本就随机放在集群的node里。
这样的策略可以保证对该block所属文件的访问能够优先在本rack下找到，如果整个rack发生了异常，也可以在另外的rack上找到该block的副本。这样足够的高效，并且同时做到了数据的容错。

但是，hadoop对机架的感知并非是自适应的，亦即，hadoop集群分辨某台slave机器是属于哪个rack并非是智能感知的，而是需要hadoop的管理者人为的告知hadoop哪台机器属于哪个rack，这样在hadoop的namenode启动初始化时，会将这些机器与rack的对应信息保存在内存中，用来作为对接下来所有的HDFS的写块操作分配datanode列表时（比如3个block对应三台datanode）的选择datanode策略，做到hadoop allocate block的策略：尽量将三个副本分布到不同的rack。
接下来的问题就是：通过什么方式能够告知hadoop namenode哪些slaves机器属于哪个rack？以下是配置步骤。

配置

默认情况下，hadoop的机架感知是没有被启用的。所以，在通常情况下，hadoop集群的HDFS在选机器的时候，是随机选择的，也就是说，很有可能在写数据时，hadoop将第一块数据block1写到了rack1上，然后随机的选择下将block2写入到了rack2下，此时两个rack之间产生了数据传输的流量，再接下来，在随机的情况下，又将block3重新又写回了rack1，此时，两个rack之间又产生了一次数据流量。在job处理的数据量非常的大，或者往hadoop推送的数据量非常大的时候，这种情况会造成rack之间的网络流量成倍的上升，成为性能的瓶颈，进而影响作业的性能以至于整个集群的服务。
要将hadoop机架感知的功能启用，配置非常简单，在namenode所在机器的core-site.xml配置文件中配置一个选项：


            topology.script.file.name
            /software/hadoop/etc/hadoop/topology.py

这个配置选项的value指定为一个可执行程序，通常为一个脚本，该脚本接受一个参数，输出一个值。接受的参数通常为某台datanode机器的ip地址，而输出的值通常为该ip地址对应的datanode所在的rack，例如”/dc1/rack1”。Namenode启动时，会判断该配置选项是否为空，如果非空，则表示已经用机架感知的配置，此时namenode会根据配置寻找该脚本，并在接收到每一个datanode的heartbeat时，将该datanode的ip地址作为参数传给该脚本运行，并将得到的输出作为该datanode所属的机架，保存到内存的一个map中。至于脚本的编写，就需要将真实的网络拓朴和机架信息了解清楚后，通过该脚本能够将机器的ip地址正确的映射到相应的机架上去。一个简单的实现如下：

#!/usr/bin/python
#coding=utf-8
import sys

rack={"192.168.137.201":"/dc1/rack1",
          "192.168.137.202":"/dc1/rack1",
          "192.168.137.203":"/dc1/rack2",
          "192.168.137.204":"/dc1/rack2",
          "s201":"/dc1/rack1",
          "s202":"/dc1/rack1",
         "s203":"/dc1/rack2",
         "s204":"/dc1/rack2"
        }

if __name__=="__main__":
   print rack.get(sys.argv[1],"/default-rack")

由于没有找到确切的文档说明到底是主机名还是ip地址会被传入到脚本，所以在脚本中最好兼容主机名和ip地址。

并且要赋予该python文件有执行的权限：chmod u+x topology.py chmod g+x topology.py

重启namenode,如果配置成功，namenode启动日志中会输出：

2017-12-12 20:47:03,923 INFO org.apache.hadoop.net.NetworkTopology: Adding a new node: /dc1/rack1/192.168.137.201:50010 这个时候说明Hadoop的机架感知已被启用。查看HADOOP机架信息命令：

[hadoop@s200 hadoop]$ hdfs dfsadmin -printTopology
Rack: /dc1/rack1
   192.168.137.201:50010 (s201)
   192.168.137.202:50010 (s202)

Rack: /dc1/rack2
   192.168.137.203:50010 (s203)
   192.168.137.204:50010 (s204)

需要注意： python脚本一定要在Linux服务器上创建，不然在windows创建之后上传会出现意想不到的一些错误；

另外有需要云服务器可以了解下创新互联scvps.cn，海内外云服务器15元起步，三天无理由+7*72小时售后在线，公司持有idc许可证，提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案，具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势，专为企业上云打造定制，能够满足用户丰富、多元化的应用场景需求。

            

            本文名称：Hadoop机架感知-创新互联            

            标题路径：http://cdkjz.cn/article/iiidd.html


        
            返回首页
            了解更多建站资讯



    相关资讯
    
        
            
                    
                        包含ios开发目前主流用什么的词条
                    
                

                    
                        怎么删除mysql的默认 Mysql怎么删除字段
                    
                

                    
                        简单表格样式css 简单表格样式大全图五列
                    
                

                    
                        html5中文网的简单介绍
                    
                

                    
                        织梦中在哪修改css样式 织梦怎么改网站主页
                    
                

                    
                        android开放标准的简单介绍
                    
                

                    
                        jquery选择儿子 jquery选择子元素
                    
                

                    
                        androidcmp=的简单介绍
                    
                
        
    


    
        
            
                多年建站经验
            
            
                多一份参考，总有益处
                 联系快上网，免费获得专属《策划方案》及报价
                
                    咨询相关问题或预约面谈，可以通过以下方式与我们联系
                     大客户专线   成都：13518219792
                          座机：028-86922220
                    
                
            
        
        
            在线咨询
            提交需求
        
    


    
        
            
                友情链接
                交换友情链接
            
            
                
                    力比特机械自适应网站设计内江做网站jxjierui.cn绵阳主机托管wzjierui.cn手机网站建设成都高电机柜租用中国（西部）云计算中心响应式网站                
            
        
    
    
        
            成都网站建设公司地址：成都市青羊区太升南路288号锦天国际A座10层 建设咨询028-86922220
            
                成都快上网科技有限公司-四川网站建设设计公司 | 蜀ICP备19037934号 Copyright 2020,ALL Rights Reserved cdkjz.cn | 成都网站建设 | © Copyright 2020版权所有.
            专家团队为您提供成都网站建设,成都网站设计,成都品牌网站设计,成都营销型网站制作等服务,成都建网站就找快上网！ | 成都网站建设哪家好？ | 网站建设地图

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

Hadoop机架感知-创新互联

背景

配置

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

Hadoop机架感知-创新互联

背景

配置

相关资讯

包含ios开发目前主流用什么的词条

怎么删除mysql的默认 Mysql怎么删除字段

简单表格样式css 简单表格样式大全图五列

html5中文网的简单介绍

织梦中在哪修改css样式 织梦怎么改网站主页

android开放标准的简单介绍

jquery选择儿子 jquery选择子元素

androidcmp=的简单介绍

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

织梦中在哪修改css样式织梦怎么改网站主页

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接