网站建设 >

查看其它板块

Linux实现文件内容去重及求交并差集的方法-创新互联

这篇文章主要讲解了Linux实现文件内容去重及求交并差集的方法，内容清晰明了，对此有兴趣的小伙伴可以学习一下，相信大家阅读完之后会有帮助。

在灵宝等地区，都构建了全面的区域性战略布局，加强发展的系统性、市场前瞻性、产品创新能力，以专注、极致的服务理念，为客户提供网站设计、网站建设网站设计制作定制网站建设,公司网站建设,企业网站建设,品牌网站建设,营销型网站,成都外贸网站建设公司,灵宝网站建设费用合理。

一、数据去重

日常工作中，使用Hive或者Impala查询导出来可能会存在数据重复的现象，但又不想重新执行一遍查询（查询时间稍长，导出文件内容多），因此想到了使用Linux命令将文件的内容重复数据进行去除。

案例如下：

可以看到aaa.txx有3条重复数据

Linux实现文件内容去重及求交并差集的方法

想去掉多余的数据，只保留一条

sort aaa.txt | uniq > bbb.txt

将aaa.txt文件中重复数据去掉，输出到bbb.txt

Linux实现文件内容去重及求交并差集的方法

可以看到bbb.txt文件中只保留了一条数据

二、数据交、并、差

1)、交集(相当于user_2019 inner join user_2020 on user_2019.user_no=user_2020.user_no)

sort user_2019.txt user_2020.txt | uniq -d

2)、并集(相当于 user_2019.user_no union user_2020.user_no)

sort user_2019.txt user_2020.txt | uniq

3)、差集

user_2019.txt-user_2020.txt
sort user_2019.txt user_2020.txt user_2020.txt | uniq -u
user_2020.txt - user_2019.txt:
sort user_2020.txt user_2019.txt user_2019.txt | uniq -u

看完上述内容，是不是对Linux实现文件内容去重及求交并差集的方法有进一步的了解，如果还想学习更多内容，欢迎关注创新互联-成都网站建设公司行业资讯频道。

网站名称：Linux实现文件内容去重及求交并差集的方法-创新互联
文章位置：http://cdkjz.cn/article/jdoei.html

返回首页了解更多建站资讯

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

大客户专线成都：13518219792 座机：028-86922220

在线咨询提交需求

友情链接交换友情链接

保温橡塑管广汉网站建设攀枝花网站建设企业网站建设成都文化衫公关活动天泽尚品图文广告制作网站运维托管成都网站推广

成都网站建设公司地址：成都市青羊区太升南路288号锦天国际A座10层建设咨询028-86922220

专家团队为您提供成都网站建设,成都网站设计,成都品牌网站设计,成都营销型网站制作等服务,成都建网站就找快上网！ | 成都网站建设哪家好？ | 网站建设地图

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

Linux实现文件内容去重及求交并差集的方法-创新互联

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

Linux实现文件内容去重及求交并差集的方法-创新互联

相关资讯

c语言主函数名什么意思 c语言中主函数名是什么

安全组网服务器配置要求 设置安全组端口全开

php读取数据库并显示 php读取mysql数据

阿里云服务器手机版 阿里云 服务器

常用的linux命令作用 linux常用命令有哪些?

关于SAP系统动态审计日志的信息

linux基础常用命令 linux常用命令大全新手入门

go语言的市场份额 go语言发展前景 知乎

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

安全组网服务器配置要求设置安全组端口全开

阿里云服务器手机版阿里云服务器

go语言的市场份额 go语言发展前景知乎

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接