Spark大数据分析:核心概念、技术及实践是关于大数据和Spark的一个简明手册。它将助你学习如何用Spark来完成很多大数据分析任务,其中覆盖了高效利用Spark所需要知道的重要主题:如何应用SparkShell进行交互式数据分析、如何编写Spark应用、如何在Spark中对大规模数据进行交互分析、如何应用SparkStreaming处理高速数据流、如何应用Spark进行机器学习、如何应用Spark进行图处理、如何应用集群管理员部署Spark、如何监控Spark应用等。本书还对其他配合Spark一起应用的大数据技术进行了介绍,包括HDFS、Avro、Parquet、Kafka、Cassandra、HBase、Mesos等。本书也对机器学习和图的概念进行了介绍。

目录

知识兔

第1章 大数据技术一览1
第2章 Scala编程16
第3章 Spark Core33
第4章 应用Spark shell进行交互式数据分析60
第5章 编写Spark应用69
第6章 Spark Streaming77
第7章 Spark SQL99
第8章 应用Spark进行机器学习146
第9章 应用Spark进行图处理196
第10章 集群管理员218
第10章 监控

下载体验

请输入密码查看内容!

如何获取密码?

 

点击下载