Spark SQL是 Spark大数据框架的一部分,支持应用标准SQL查询和HiveQL来读写数据,可用于结构化数据处理,并可以执行类似SQL的Spark数据查询,有助于开发人员更快地创建和运行Spark程序。

《Spark SQL入门与实践指南》分为4篇,共9章,第一篇讲解了Spark SQL 发展历史和开发环境搭建。第二篇讲解了Spark SQL 实例,使得读者掌握Spark SQL的入门操作,了解Spark RDD、DataFrame和DataSet,并熟悉 DataFrame 各种操作。第三篇讲解了基于WiFi探针的商业大数据分析项目,实例中包含数据采集、预处理、存储、利用Spark SQL 挖掘数据,一步一步带领读者学习Spark SQL强大的数据挖掘功能。第四篇讲解了Spark SQL 优化的知识。

本书适合Spark初学者、Spark数据分析人员以及Spark程序开发人员,也适合高校和培训学校相关专业的师生教学参考。

目录

知识兔

第一部分 入门篇
第1章 初识Spark SQL 3
第2章 Spark安装、编程环境搭建以及打包提交 6
第二部分 基础篇
第3章 Spark上的RDD编程 23
第4章 Spark SQL编程入门 66
第5章 Spark SQL的DataFrame操作大全 82
第6章 Spark SQL支持的多种数据源 121
第三部分 实践篇
第7章 Spark SQL 工程实战之基于WiFi探针的商业大数据分析技术139
第8章 第一个Spark SQL应用程序 145
第四部分 优化篇
第9章 让Spark程序再快一点 175

下载体验

请输入密码查看内容!

如何获取密码?

 

点击下载