Spark高级数据分析(第2版)是应用Spark进行大规模数据分析的实战宝典,由知名数据科学家撰写。本书在第1版的基础上,针对Spark近年来的发展,对样例代码和所应用的资料进行了大量更新。新版Spark应用了全新的核心API,MLlib和Spark SQL两个子项目也发生了较大变化,本书为关注Spark发展趋势的读者分享了与时俱进的资料,例如Dataset和DataFrame的应用,以及与DataFrame API高度集成的Spark ML API。

目录

知识兔

第1章 大数据分析 1
第2章 用Scala 和Spark 进行数据分析 8
第3章 音乐推荐和Audioscrobbler数据集 37
第4章 用决策树算法预测森林植被 58
第5章 基于K均值聚类的网络流量异常检测 84
第6章 基于潜在语义分析算法分析维基百科 104
第7章 用GraphX分析伴生网络 124
第8章 纽约出租车轨迹的空间和时间数据分析 151
第9章 基于蒙特卡罗模拟的金融风险评估 170
第10章 基因数据分析和BDG项目 190
第11章 基于PySpark和Thunder的神经图像数据分析 211

下载体验

请输入密码查看内容!

如何获取密码?

 

点击下载