Hadoop采用64M的分块有什么优势-快上网网站建设公司

Hadoop采用64M的分块有什么优势

小编给大家分享一下Hadoop采用64M的分块有什么优势，相信大部分人都还不怎么了解，因此分享这篇文章给大家参考一下，希望大家阅读完这篇文章后大有收获，下面让我们一起去了解一下吧！

创新互联公司成立以来不断整合自身及行业资源、不断突破观念以使企业策略得到完善和成熟，建立了一套“以技术为基点，以客户需求中心、市场为导向”的快速反应体系。对公司的主营项目，如中高端企业网站企划 / 设计、行业 / 企业门户设计推广、行业门户平台运营、手机APP定制开发、手机网站制作、微信网站制作、软件开发、德阳机房服务器托管等实行标准化操作，让客户可以直观的预知到从创新互联公司可以获得的服务效果。

减少硬盘寻道时间(disk seek time)

HDFS设计前提是支持大容量的流式数据操作，所以即使是一般的数据读写操作，涉及到的数据量都是比较大的。假如数据块设置过少，那需要读取的数据块就比较多，由于数据块在硬盘上非连续存储，普通硬盘因为需要移动磁头，所以随机寻址较慢，读越多的数据块就增大了总的硬盘寻道时间。当硬盘寻道时间比io时间还要长的多时，那么硬盘寻道时间就成了系统的一个瓶颈。 合适的块大小有助于减少硬盘寻道时间，提高系统吞吐量。

减少Namenode内存消耗

对于HDFS，他只有一个Namenode节点，他的内存相对于Datanode来说，是极其有限的。然而，namenode需要在其内存FSImage文件中中记录在Datanode中的数据块信息，假如数据块大小设置过少，而需要维护的数据块信息就会过多，那Namenode的内存可能就会伤不起了。

为什么不能远大于64MB(或128MB或256MB)

这里主要从上层的MapReduce框架来讨论

Map崩溃问题：

系统需要重新启动，启动过程需要重新加载数据，数据块越大，数据加载时间越长，系统恢复过程越长。

监管时间问题：

主节点监管其他节点的情况，每个节点会周期性的把完成的工作和状态的更新报告回来。如果一个节点保持沉默超过一个预设的时间间隔，主节点记录下这个节点状态为死亡，并把分配给这个节点的数据发到别的节点。对于这个“预设的时间间隔”，这是从数据块的角度大概估算的。假如是对于64MB的数据块，我可以假设你10分钟之内无论如何也能解决了吧，超过10分钟也没反应，那就是死了。可对于640MB或是1G以上的数据，我应该要估算个多长的时间内？估算的时间短了，那就误判死亡了，分分钟更坏的情况是所有节点都会被判死亡。估算的时间长了，那等待的时间就过长了。所以对于过大的数据块，这个“预设的时间间隔”不好估算。

问题分解问题：

数据量大小是问题解决的复杂度是成线性关系的。对于同个算法，处理的数据量越大，它的时间复杂度也就越大。

约束Map输出：

在Map Reduce框架里，Map之后的数据是要经过排序才执行Reduce操作的。想想归并排序算法的思想，对小文件进行排序，然后将小文件归并成大文件的思想，然后就会懂这点了....

以上是“Hadoop采用64M的分块有什么优势”这篇文章的所有内容，感谢各位的阅读！相信大家都有了一定的了解，希望分享的内容对大家有所帮助，如果还想学习更多知识，欢迎关注创新互联行业资讯频道！

网站栏目：Hadoop采用64M的分块有什么优势
文章出自：http://cdkjz.cn/article/geopsj.html

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

Hadoop采用64M的分块有什么优势

减少硬盘寻道时间(disk seek time)

减少Namenode内存消耗

为什么不能远大于64MB(或128MB或256MB)

Map崩溃问题：

监管时间问题：

问题分解问题：

约束Map输出：

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

Hadoop采用64M的分块有什么优势

减少硬盘寻道时间(disk seek time)

减少Namenode内存消耗

为什么不能远大于64MB(或128MB或256MB)

Map崩溃问题：

监管时间问题：

问题分解问题：

约束Map输出：

相关资讯

vb.net基本增删改查 vb增删改查sql数据库

怎么强制停止oracle 怎么强制停止健康使用手机

抓取网页的java代码 java爬虫抓取网页数据

php取出数据库内容格式 php取出数据库内容格式不一致

python函数后面的点 python中函数名后面加点

vb.net单精度浮点 vb中定义单精度浮点

补码C语言转换原码的函数 补码c语言转换原码的函数怎么算

python默认比较函数 python默认函数参数

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

补码C语言转换原码的函数补码c语言转换原码的函数怎么算

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接