《Hadoop构建数据仓库实践》讲述在流行的大数据分布式存储和计算平台Hadoop上设计实现数据仓库,将传统数据仓库建模与SQL开发的简单性与大数据技术相结合,快速、高效地建立可扩展的数据仓库及其应用系统。
本书内容包括数据仓库、Hadoop及其生态圈的相关概念,应用Sqoop从关系数据库全量或增量抽取数据,应用HIVE进行数据转换和装载处理,应用Oozie调度作业周期性执行,应用Impala进行快速联机数据分析,应用Hue将数据可视化,以及数据仓库中的渐变维(SCD)、代理键、角色扮演维度、层次维度、退化维度、无事实的事实表、迟到的事实、累积的度量等常见问题在Hadoop上的处理等。
本书适合数据库管理员、大数据技术人员、Hadoop技术人员、数据仓库技术人员,也适合高等院校和培训机构相关专业的师生教学参考。
目录
第1章 数据仓库简介
第2章 数据仓库设计基础
第3章 Hadoop生态圈与数据仓库
第4章 安装Hadoop
第5章 Kettle与Hadoop
第6章 建立数据仓库示例模型
第7章 数据抽取
第8章 数据转换与装载
第9章 定期自动执行ETL作业
第10章 维度表技术
第11章 事实表技术
第12章 联机分析处理
第13章 数据可视化
下载体验