大数据正在爆炸式增长,每天都有来自世界各地的公司涌现出新的项目。
江城ssl适用于网站、小程序/APP、API接口等需要进行数据传输应用场景,ssl证书未来市场广阔!成为创新互联建站的ssl证书销售渠道,可以享受市场价格4-6折优惠!如果有意向欢迎电话联系或者加微信:18982081108(备注:SSL证书合作)期待与您的合作!好消息是,所有技术都是开源的,可供您今天开始采用。
Hadoop
稳固,企业实力和其他一切的基础。您需要YARN和HDFS以及Hadoop的基础架构作为主要数据存储并运行关键的大数据服务器和应用程序
Spark
易于使用,支持所有重要的大数据语言(Scala,Python,Java,R),一个庞大的生态系统,快速增长,易于微缩/批处理/ SQL支持。这是另一个明智的选择。
在这里还是要推荐下我自己建的大数据学习交流群:529867072,群里都是学大数据开发的,如果你正在学习大数据 ,小编欢迎你加入,大家都是软件开发党,不定期分享干货(只有大数据软件开发相关的),包括我自己整理的一份最新的大数据进阶资料和高级开发教程,欢迎进阶中和进想深入大数据的小伙伴加入。
NiFi
Apache Hive 2.1
Apache Hive一直是Hadoop上的SQL解决方案。通过最新版本,性能和功能增强,Hive成为大数据SQL的解决方案。
Kafka
Phoenix
HBase -开源的BigTable,大量公司致力于HBase并使其规模庞大。NoSQL由HDFS支持,并与所有工具完美集成。在HBase上添加凤凰城的建设正在使其成为NoSQL的选。这为HBase添加了SQL,JDBC,OLTP和操作分析。
Zeppelin
H2O
H2O填补了Spark的机器学习的空白,并且正常工作。它可以完成您所需的所有机器学习。
Apache Beam
Java中数据处理管道开发的统一框架。这允许您也支持Spark和Flink。其他框架将上线,您不必学习太多框架。
Stanford CoreNLP
自然语言处理是巨大的,只是增长更多。斯坦福大学正在继续改进他们的框架。
显然,有大量的大数据项目,因此您最好的选择是从基础分发开始,该分布包含并测试项目的各个版本,并确保它们与安全性和管理平稳地协同工作。我建议使用Hortonworks Connected Data Platforms作为您的基础。如果我们进入前20名,我会添加更多项目,特别是Storm, SOLR,Apache Oozie和Apache HAWQ。下面有很多很棒的技术,在大多数情况下,你没有看到或知道像Apache Tez(虽然你需要在运行Hive时配置它),Apache Calcite,Apache Slider,Apache Zookeeper和 Livy。这些项目对于运行大数据基础架构至关重要。
另外有需要云服务器可以了解下创新互联scvps.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。