大数据入门指南（GitHub开源项目）-快上网网站建设公司

大数据入门指南（GitHub开源项目）

项目GitHub地址：https://github.com/heibaiying/BigData-Notes
成都创新互联公司坚持“要么做到，要么别承诺”的工作理念，服务领域包括：网站制作、成都网站制作、企业官网、英文网站、手机端网站、网站推广等服务，满足客户于互联网时代的怀仁网站设计、移动媒体设计的需求，帮助企业找到有效的互联网解决方案。努力成为您成熟可靠的网络建设合作伙伴！

前言

大数据技术栈思维导图
大数据常用软件安装指南

一、Hadoop

分布式文件存储系统——HDFS
分布式计算框架——MapReduce
集群资源管理器——YARN
Hadoop单机伪集群环境搭建
Hadoop集群环境搭建
HDFS常用Shell命令
HDFS Java API的使用
基于Zookeeper搭建Hadoop高可用集群

二、Hive

Hive简介及核心概念
Linux环境下Hive的安装部署
Hive CLI和Beeline命令行的基本使用
Hive 常用DDL操作
Hive 分区表和分桶表
Hive 视图和索引
Hive常用DML操作
Hive 数据查询详解

三、Spark

Spark Core :

Spark简介
Spark开发环境搭建
弹性式数据集RDD
RDD常用算子详解
Spark运行模式与作业提交
Spark累加器与广播变量
基于Zookeeper搭建Spark高可用集群

Spark SQL :

DateFrame 和 DataSet
Structured API的基本使用
Spark SQL外部数据源
Spark SQL常用聚合函数
Spark SQL JOIN 操作

Spark Streaming ：

Spark Streaming 简介
Spark Streaming 基本操作
Spark Streaming 整合 Flume
Spark Streaming 整合 Kafka

四、Storm

Storm和流处理简介
Storm核心概念详解
Storm单机环境搭建
Storm集群环境搭建
Storm编程模型详解
Storm项目三种打包方式对比分析
Storm集成redis详解
Storm集成HDFS/HBase
Storm集成Kafka

五、Flink

TODO

六、HBase

Hbase 简介
HBase系统架构及数据结构
HBase基本环境搭建(Standalone /pseudo-distributed mode)
HBase集群环境搭建
HBase常用Shell命令
HBase Java API
Hbase 过滤器详解
HBase 协处理器详解
HBase 容灾与备份
HBase的SQL中间层——Phoenix
Spring/Spring Boot 整合 Mybatis + Phoenix

七、Kafka

Kafka 简介
基于Zookeeper搭建Kafka高可用集群
Kafka 生产者详解
Kafka 消费者详解
深入理解Kafka副本机制

八、Zookeeper

Zookeeper 简介及核心概念
Zookeeper单机环境和集群环境搭建
Zookeeper常用Shell命令
Zookeeper Java 客户端——Apache Curator
Zookeeper ACL权限控制

九、Flume

Flume简介及基本使用
Linux环境下Flume的安装部署
Flume整合Kafka

十、Sqoop

Sqoop简介与安装
Sqoop的基本使用

十一、Azkaban

Azkaban简介
Azkaban3.x 编译及部署
Azkaban Flow 1.0 的使用
Azkaban Flow 2.0 的使用

十二、Scala

Scala简介及开发环境配置
基本数据类型和运算符
流程控制语句
数组——Array
集合类型综述
常用集合类型之——List & Set
常用集合类型之——Map & Tuple
类和对象
继承和特质
函数 & 闭包 & 柯里化
模式匹配
类型参数
隐式转换和隐式参数

十三、公共内容

大数据应用常用打包方式

后记

资料分享与开发工具推荐
项目GitHub地址：https://github.com/heibaiying/BigData-Notes

当前标题：大数据入门指南（GitHub开源项目）
链接URL：http://cdkjz.cn/article/jihgds.html

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

大数据入门指南（GitHub开源项目）

前言

一、Hadoop

二、Hive

三、Spark

四、Storm

五、Flink

六、HBase

七、Kafka

八、Zookeeper

九、Flume

十、Sqoop

十一、Azkaban

十二、Scala

十三、公共内容

后记

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

大数据入门指南（GitHub开源项目）

前 言

一、Hadoop

二、Hive

三、Spark

四、Storm

五、Flink

六、HBase

七、Kafka

八、Zookeeper

九、Flume

十、Sqoop

十一、Azkaban

十二、Scala

十三、公共内容

后 记

相关资讯

windows系统iso的简单介绍

l老男孩go语言 老男孩go语言培训多少钱

go语言视频教程百度网盘 go百度云

哄女朋友的java源代码 哄女生开心的代码Java

php多表查询大数据 php如何实现多表查询

包含vb.net报表怎么使用的词条

go语言是哪个团队的 go语言是什么语言开发的

javaif循环代码 javaif循环语句

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

前言

后记

l老男孩go语言老男孩go语言培训多少钱

哄女朋友的java源代码哄女生开心的代码Java

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接