Spark大数据处理: 原理、算法与实例以时下流行的Hadoop所存在的缺陷为出发点,深入浅出地介绍了下一代大数据处理核心技术Spark的优势和必要性,并以简洁的指引步骤展示了如何在10分钟内建立一个Spark大数据处理环境。在此基础上,本书以图文并茂和丰富的示例代码讲解的形式系统性地揭示了Spark的运行原理、算子应用、算法设计和优化手段,为读者分享了一个快速由浅入深掌握Spark基础能力和高级技巧的参考书籍。
本书共六章,涉及的主题主要包括大数据处理技术从Hadoop发展到Spark的必然性、快速体验Spark的指引、Spark架构和原理、RDD算子应用方法和示例、Spark算法设计实例、Spark程序优化方法。
本书适合需要应用Spark进行大数据处理的程序员、架构师和产品经理作为技术参考和培训资料,亦可作为高校研究生和本科生教材。
目录
第1章从Hadoop到Spark
第2章体验Spark
第3章Spark原理
第4章RDD算子
第5章Spark算法设计
第6章善用Spark
下载体验