从品牌网站建设到网络营销策划,从策略到执行的一站式服务
这篇文章主要讲解了“HIVE实现wordcount的过程”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“HIVE实现wordcount的过程”吧!
10年积累的成都做网站、网站建设、外贸营销网站建设经验,可以快速应对客户对网站的新想法和需求。提供各种问题对应的解决方案。让选择我们的客户得到更好、更有力的网络服务。我虽然不认识你,你也不认识我。但先网站制作后付款的网站建设流程,更有运河免费网站建设让你可以放心的选择与我们合作。
1、建表并关联数据:
进入hive命令行:
hive
执行:
create external table wordcounts(line string) row format delimited fields terminated by '\n' stored as textfile location '/input/wordcount';
2、创建ruozedata.txt文件,并上传hdfs中的/input/wordcount目录下。
vi ruozedata.txt
hello,ruoze
hello,jepsondb
hello,www.ruozedata.com
hi,man
hi,gril
上传命令:hdfs dfs -put ruozedata.txt /input/wordcount
3、进入HIVE,查询是否已经将数据关联到表中
select * from wordcounts;
4、进入HIVE,进行拆分,把每行数据拆分成单词,这里需要用到一个hive的内置表生成函数(UDTF):explode(array),参数是array,其实就是行变多列:
split是拆分函数,与java的split功能一样,这里是按照逗号拆分,再对子查询中的结果进行group by word,执行完hql语句如下:
select word, count(*) from (select explode(split(line, ",")) as word from wordcounts) t group by word;
总结:hive比较简便,对于比较复杂的统计操作可以建一些中间表。
感谢各位的阅读,以上就是“HIVE实现wordcount的过程”的内容了,经过本文的学习后,相信大家对HIVE实现wordcount的过程这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是创新互联,小编将为大家推送更多相关知识点的文章,欢迎关注!
成都网站建设公司地址:成都市青羊区太升南路288号锦天国际A座10层 建设咨询028-86922220
成都快上网科技有限公司-四川网站建设设计公司 | 蜀ICP备19037934号 Copyright 2020,ALL Rights Reserved cdkjz.cn | 成都网站建设 | © Copyright 2020版权所有.
专家团队为您提供成都网站建设,成都网站设计,成都品牌网站设计,成都营销型网站制作等服务,成都建网站就找快上网! | 成都网站建设哪家好? | 网站建设地图