Hadoop是目前采用最广、最重要的一种开源的大数据处理平台,读懂Hadoop的源代码,深入理解其各种机理,对于掌握大数据处理的技术有着显而易见的重要性。毛德操著的《大数据处理系统(Hadoop源代码情景分析)》从大数据处理的原理开始,讲到Hadoop的由来,进而讲述对于代码的研究方法,然后以Hadoop作为样本,较为详尽地逐一分析大数据处理平台各核心组成部分的代码,并从宏观上讲述这些部分的联系和作用。
本书沿用作者独特而广受欢迎的情景分析方法和风格,深入浅出直白易懂,可以作为大数据系统高级课程的教材,也可用作计算机软件专业和其他相关专业大学本科高年级学生和研究生深入学习大数据系统的参考书。同时,还可以作为各行业从事软件开发和数据挖掘的工程师、研究人员以及其他对大数据处理技术感兴趣者的自学教材。
目录
第1章 大数据与Hadoop
第2章 研究方法
第3章 Hadoop集群和YARN
第4章 Hadoop的RPC机制
第5章 Hadoop作业的提交
第6章 作业的调度与指派
第7章 NodeManager与任务投运
第8章 MRAppMaster与作业投运
第9章 YARN子系统的计算框架
第10章 MapReduce框架中的数据流
第11章 Hadoop的文件系统HDFS
第12章 HDFS的DataNode
第13章 DataNode与NameNode的互动
第14章 DataNode间的互动
第15章 HDFS的文件访问
第16章 Hadoop的容错机制
第17章 Hadoop的安全机制
第18章 Hadoop的人机界面
第19章 Hadoop的部署和启动
第20章 Spark的优化与改进
下载体验