什么是 Hive
Hive 是一个翻译器,它可以将SQL语句翻译成一个 MapReduce 程序
常见的数据分析引擎: Hive, Pig, Impala, Spark SQL
Hive 是一个基于Hadoop 之上的数据分析引擎(数据仓库)
Hives HDFS
表 --------> 目录
数据 --------> 文件
分区 --------> 目录
环境部署:
部署前准备:
环境变量:vi ~/.bash_profile
HIVE_HOME=/root/training/apache-hive-2.3.0-bin
export HIVE_HOME
PATH=$HIVE_HOME/bin:$PATH
export PATH
嵌入式部署:
(1)使用Hive自带的Derby数据库来存储元信息
(2)Hive只支持一个连接
创建 conf/hive-site.xml
初始化MetaStore:
schematool -dbType derby -initSchema
远程模式(需要MySQL数据库):
1. 安装 MySQL数据库(此处省略)
2. 配置 hive-site.xml (JDBC的参数)
3. 把MySQL 数据库的驱动放到: Hive/lib 下
4. 初始化 MySQL数据库
老版本的hive 在第一次运行时自动初始化 MySQL数据库
新版本的hive 需要执行命令:
schematool -dbType mysql -initSchema
另外有需要云服务器可以了解下创新互联scvps.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。