网站建设 >

查看其它板块

二、hdfs体系架构

[TOC]

专注于为中小企业提供成都网站设计、做网站、成都外贸网站建设公司服务,电脑端+手机端+微信端的三站合一,更高效的管理,为中小企业青羊免费做网站提供优质的服务。我们立足成都，凝聚了一批互联网行业人才，有力地推动了超过千家企业的稳健成长，帮助中小企业通过网站建设实现规模扩充和转变。

一、HDFS体系组成概述

这是一个分布式文件系统，适用于于一次写入多次读取的场景。包含以下角色：

NameNode(nn)：
存储文件的元数据，如文件名、文件目录结构，文件属性等，以及每个文件的块列表和块所在的DataNode等。以及响应客户端对hdfs的读写操作,如创建目录、上传文件等。还有保存读写日志。

DataNode(dn)：
在本地文件系统中存储文件块数据，以及块数据的校验和

SecondaryNameNode(snn)：
用来监控HDFS状态的辅助后台程序，每隔一段时间获取HDFS元数据的快照，相当于对NameNode进行备份。

二、HDFS-NameNode

主要职责是管理hdfs的所有节点。
1、响应客户端对hdfs的请求，如增删改查。
2、管理和维护hdfs 的元数据信息以及日志（非log日志）

NameNode会在 core-site.xml中指定的hadoop.tmp.dir 的目录中创建目录：dfs/name/ 。下面我们看看这个目录的结构。

[root@bigdata121 tmp]# tree dfs/name
dfs/name
├── current
│   ├── edits_0000000000000000001-0000000000000000002
│   ├── edits_0000000000000000003-0000000000000000004
│   ├── edits_0000000000000000005-0000000000000000006
│   ├── edits_0000000000000000007-0000000000000000008
│   ├── edits_0000000000000000009-0000000000000000009
│   ├── edits_0000000000000000010-0000000000000000011
│   ├── edits_0000000000000000012-0000000000000000013
│   ├── edits_0000000000000000014-0000000000000000015
│   ├── edits_0000000000000000016-0000000000000000017
│   ├── edits_0000000000000000018-0000000000000000019
│   ├── edits_0000000000000000020-0000000000000000021
│   ├── edits_0000000000000000022-0000000000000000024
│   ├── edits_0000000000000000025-0000000000000000026
│   ├── edits_inprogress_0000000000000000027
│   ├── fsimage_0000000000000000024
│   ├── fsimage_0000000000000000024.md5
│   ├── fsimage_0000000000000000026
│   ├── fsimage_0000000000000000026.md5
│   ├── seen_txid
│   └── VERSION
└── in_use.lock

各个文件目录的作用如下：

1、current

主要存放hdfs的存储的数据的元信息和日志。

（1）edits文件

是一个二进制文件，主要记录对hdfs的增删改操作的信息，类似于MySQL的二进制日志。其中 edits_inprogress_xxxxx 表示是最新的edits日志，是目前正在使用的。
可以使用命令查看 edits文件的内容：

//格式：hdfs oev -i 输入文件 -o 输出文件（xml格式）
[root@bigdata121 current]# hdfs oev -i edits_inprogress_0000000000000000038 -o /tmp/edits_inprogess.xml

[root@bigdata121 current]# cat /tmp/edits_inprogess.xml


  -63
  
    OP_START_LOG_SEGMENT   表示操作的类别，这里是表示日志开始记录
    
      38  类似于操作的ID，是唯一的
    
  



    OP_ADD_BLOCK     //像这个就表示上传文件的操作
    
      34
      /jdk-8u144-linux-x64.tar.gz._COPYING_
      
        1073741825
        134217728
        1001
      
      
        1073741826
        0
        1002
      
      
      -2

（2）fsimage文件

hdfs中的数据的元数据文件。记录hdfs文件系统中各个数据块的信息，但并不是最新的。需要定时将edits文件合并到这里，才是最新的。可以使用命令查看 fsimage 文件的内容：

//格式 ： hdfs oiv -p 输出格式 -i 输入文件 -o 输出文件
[root@bigdata121 current]# hdfs oiv -p XML -i fsimage_0000000000000000037 -o /tmp/fsimage37.xml

[root@bigdata121 current]# cat /tmp/fsimage37.xml

-63117e75c2a11685af3e043aa5e604dc831e5b14674
1780930535100010020107374182637
16387316385DIRECTORY1558145602785root:supergroup:07559223372036854775807-1
16386DIRECTORYinput1558105166840root:supergroup:0755-1-1
16387FILEjdk-8u144-linux-x64.tar.gz215581456027531558145588521134217728root:supergroup:064410737418251001134217728
1073741826100251298114

0

00
163851638616387


0000100

记录的信息更为详细。文件的元数据，如文件权限、时间戳等都有记录。

（3）seen_txid

txid是类似于事件id的概念，指的是每个操作的一个标识。这个文件中记录的是最新的txid的下一个，即当前最后一个txid是37，那么该文件记录的就是38.

（4）fsimage和edit文件命名方式的联系

edits文件：
我们可以看到edits文件都是 edits_00000xxx-000000xxx的方式命名的，其实意思就是表示该edits文件中记录了txid操作事件的范围。而 edit_inprogess_00000xxx 则表示当前所记录到的最新的txid事件。

fsimage文件：
以fsimage_000000xxx 的方式命名，表示的是该fsimage 文件记录到的最新的txid事件，请注意，因为fsimage是有条件触发之后，edits文件才会合并到fsimage的，否则不会合并。所以一般情况下，edits文件后面的txid肯定是比fsimage 大的。

2、in_use.lock

这个文件主要是对当前的node进行锁操作，避免当前机器同时启动多个namenode。只能启动一个namenode

三、HDFS-DataNode

HDFS的数据节点，主要就是存储数据的block文件的。会在指定的目录下创建一个 dfs/data 目录，看一下目录结构：

[root@bigdata122 dfs]# tree data
data
├── current
│   ├── BP-1130553825-192.168.50.121-1557922928723
│   │   ├── current
│   │   │   ├── finalized
│   │   │   │   └── subdir0
│   │   │   │       └── subdir0
│   │   │   │           ├── blk_1073741825
│   │   │   │           ├── blk_1073741825_1001.meta
│   │   │   │           ├── blk_1073741826
│   │   │   │           └── blk_1073741826_1002.meta
│   │   │   ├── rbw
│   │   │   └── VERSION
│   │   ├── scanner.cursor
│   │   └── tmp
│   └── VERSION
└── in_use.lock

在HDFS中，文件都是被分割成多个等大的数据块进行存储的。
hadoop 1.x 中数据块默认大小是 64M
hadoop 2.x 中数据块默认大小是 128M
hadoop 3.x 中不再采用多副本的模式存储，而是采用纠删码技术。
请见 https://www.cnblogs.com/basenet855x/p/7889994.html

在上面的目录中 blk_xxxxx 的文件其实就是blk文件，每个的大小为指定的块大小。

四、HDFS-SecondaryNameNode

用来监控HDFS状态的辅助后台程序，主要就是辅助 NameNode节点的工作（并非是 NameNode的备节点），其中主要工作就是合并edits文件到fsimage文件。
1、根据 checkpoint的时间间隔（默认3600秒）或者 edits文件到达64M 的触发条件，将edits文件合并fsimage。
2、edits合并到fsimage之后，edits文件可以清空了。

分享标题：二、hdfs体系架构
本文链接：http://cdkjz.cn/article/jccdos.html

返回首页了解更多建站资讯

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

大客户专线成都：13518219792 座机：028-86922220

在线咨询提交需求

友情链接交换友情链接

400电话办理成都活动策划网站seo优化移动服务器托管温江网站建设四川成都展柜定制厂家子晨包装水泥基自流平网站推广成都联通服务器托管

成都网站建设公司地址：成都市青羊区太升南路288号锦天国际A座10层建设咨询028-86922220

专家团队为您提供成都网站建设,成都网站设计,成都品牌网站设计,成都营销型网站制作等服务,成都建网站就找快上网！ | 成都网站建设哪家好？ | 网站建设地图

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

二、hdfs体系架构

一、HDFS体系组成概述

二、HDFS-NameNode

1、current

（1）edits文件

（2）fsimage文件

（3）seen_txid

（4）fsimage和edit文件命名方式的联系

2、in_use.lock

三、HDFS-DataNode

四、HDFS-SecondaryNameNode

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

二、hdfs体系架构

一、HDFS体系组成概述

二、HDFS-NameNode

1、current

（1）edits文件

（2）fsimage文件

（3）seen_txid

（4）fsimage和edit文件命名方式的联系

2、in_use.lock

三、HDFS-DataNode

四、HDFS-SecondaryNameNode

相关资讯

javascript爬虫,javascript爬虫框架

flutter能用了吗,flutter常见问题

php点击筛选数据,php商品筛选

jquery过时了吗,jquery过时了吗 2021

关于nosql区块链的信息

java键盘输出代码,java键盘输入输出

javascript评测,JavaScript

关于怎么装macos系统的信息

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接