深入理解大数据:大数据处理与编程实践在总结多年来MapReduce并行处理技术课程教学经验和成果的基础上,与业界著名企业Intel公司的大数据技术和产品开发团队和资深工程师联合,以学术界的教学成果与业界高水平系统研发经验完美结合,在理论联系实际的基础上,在基础理论原理、实际算法设计方法以及业界深度技术三个层面上,精心组织材料编写而成。
全书的主要内容包括:
■ 大数据处理技术与Hadoop MapReduce简介
■ Hadoop系统的安装和操作管理
■ 大数据分布式文件系统HDFS
■ Hadoop MapReduce并行编程模型、框架与编程接口
■ 分布式数据库HBase
■ 分布式数据仓库Hive
■ Intel Hadoop系统优化与功能增强
■ MapReduce基础算法程序设计
■ MapReduce高级程序设计技术
■ MapReduce机器学习与数据挖掘基础算法
■ 大数据处理算法与应用编程案例
深入理解大数据:大数据处理与编程实践 目录
第一部分 Hadoop系统
第1章 大数据处理技术简介 2
第2章 Hadoop系统的安装与操作管理 39
第3章 大数据存储——分布式文件系统HDFS 56
第4章 Hadoop MapReduce并行编程框架 91
第5章 分布式数据库HBase 123
第6章 分布式数据仓库Hive 179
第7章 Intel Hadoop系统优化与功能增强 200
第二部分 MapReduce的编程和算法设计
第8章 MapReduce基础算法程序设计 220
第9章 MapReduce高级程序设计技术 256
第10章 MapReduce数据挖掘基础算法 295
第11章 大数据处理算法设计与应用编程案例 352
下载体验