网站建设 >

查看其它板块

hadoop下怎么计算MapReduce过程中需要的缓冲区大小

本篇内容介绍了“hadoop下怎么计算MapReduce过程中需要的缓冲区大小”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！

创新新互联，凭借十余年的成都网站设计、网站制作经验，本着真心·诚心服务的企业理念服务于成都中小企业设计网站有近千家案例。做网站建设，选成都创新互联。

在Map阶段，map函数会产生中间数据输出并保存在内存缓冲区中（缓冲区大小由io.sort.mb参数指定）。一旦达到占用阈值（默认是80%），缓冲区的内容就会写入本地磁盘，这也就是所谓的溢写（spill）。

缓冲区内会存储溢写记录的元数据（每条数据元数据长度为16字节）和溢写记录。

分配给元数据的空间由参数io.sort.record.percent指定，默认5%，其余分配给溢写记录使用。

要确定缓冲区所需的内存空间，需要计算溢写记录和元数据分别所占空间大小。

具体计算方法如下：

Record length = Map output bytes / Map output records = 68022178 / 472293 = 144bytes

Spilled Records Size = Spilled Records * Record length = 144 * 472293 = 68022178 = 64M

Metadata Size = Metadata length * Spilled Records = 16 * 472293 = 7556688 = 7M

io.sort.record.percent = 16 / (16 + 144) = 0.1

io.sort.mb = Metadata size + Spilled Records size = 64 + 7 = 71M

本文题目：hadoop下怎么计算MapReduce过程中需要的缓冲区大小
链接地址：http://cdkjz.cn/article/sdhhp.html

返回首页了解更多建站资讯

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

大客户专线成都：13518219792 座机：028-86922220

在线咨询提交需求

友情链接交换友情链接

四川鸿达成都产品认证 wjzwz.com 企业画册设计制作 3D立体画四川网站建设金堂发电机成都珉田数据中心东电技服蜜朵婚庆

成都网站建设公司地址：成都市青羊区太升南路288号锦天国际A座10层建设咨询028-86922220

专家团队为您提供成都网站建设,成都网站设计,成都品牌网站设计,成都营销型网站制作等服务,成都建网站就找快上网！ | 成都网站建设哪家好？ | 网站建设地图

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

hadoop下怎么计算MapReduce过程中需要的缓冲区大小

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

hadoop下怎么计算MapReduce过程中需要的缓冲区大小

相关资讯

抖音小店代运营如何授权

直播代运营介绍有哪些？如何选择适合自己的直播运营团队？

短视频代运营公司靠谱吗？如何选择可信赖的公司？

常州短视频运营策略研究

直播运营怎么样才能实现商业化盈利？

成都广告短视频代运营

电商短视频网络营销,网络营销与直播电商专业学什么

短视频剪辑账号运营方案

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接