Spark大数据分析:核心概念、技术及实践是关于大数据和Spark的一个简明手册。它将助你学习如何用Spark来完成很多大数据分析任务,其中覆盖了高效利用Spark所需要知道的重要主题:如何应用SparkShell进行交互式数据分析、如何编写Spark应用、如何在Spark中对大规模数据进行交互分析、如何应用SparkStreaming处理高速数据流、如何应用Spark进行机器学习、如何应用Spark进行图处理、如何应用集群管理员部署Spark、如何监控Spark应用等。本书还对其他配合Spark一起应用的大数据技术进行了介绍,包括HDFS、Avro、Parquet、Kafka、Cassandra、HBase、Mesos等。本书也对机器学习和图的概念进行了介绍。
目录
第1章 大数据技术一览1
第2章 Scala编程16
第3章 Spark Core33
第4章 应用Spark shell进行交互式数据分析60
第5章 编写Spark应用69
第6章 Spark Streaming77
第7章 Spark SQL99
第8章 应用Spark进行机器学习146
第9章 应用Spark进行图处理196
第10章 集群管理员218
第10章 监控
下载体验