10多位技术专家结合自己10多年的经验,以电信、航空、医疗等多个行业的实战案例为主线,深入浅出地讲解了如何基于Hadoop架构技术进行大数据挖掘建模、数据分析和二次开发。

本书共16章,分三个部分:基础篇、实战篇、高级篇。
基础篇(第1~6章),第1章的主要内容是数据挖掘概述、大数据餐饮行业应用;第2章针对大数据理论知识进行基础讲解,简明扼要地对Hadoop安装、原理等做了介绍;第3章介绍了大数据仓库Hive的安装、原理等内容;第4章介绍了大数据数据库HBase的安装、原理等内容;第5章介绍了几种大数据挖掘建模平台,同时重点介绍了本书应用的开源TipDM-HB大数据挖掘平台;第6章对数据挖掘的建模过程,各种挖掘建模的常用算法与原理及其在大数据挖掘算法库Mahout的实现原理进行了介绍。
实战篇(第7~14章),重点对大数据挖掘技术在法律咨询、电子商务、航空、移动通信、互联网、生产制造以及公共服务等行业的应用进行了分析。在案例结构组织上,本书是按照先介绍案例背景与挖掘目标,再阐述大数据时代针对大数据的分析方法与过程,最后完成模型构建的顺序进行,对建模过程等关键环节进行了详细的分析。最后通过上机实践,加深对大数据挖掘技术以及分析流程的认识。
高级篇(第15~16章),介绍了基于Hadoop大数据开发的相关技术以及开发步骤,同时应用实例来展示这些步骤,使读者可以自己动手实践,亲自体会开发的乐趣;同时,还介绍了基于TipDM-HB大数据挖掘平台的二次开发实例,借助TipDM-HB大数据挖掘平台二次开发工具,可以更加快捷、高效地完成相关大数据应用的二次开发,降低开发难度,使读者更方便地体会到大数据分析与挖掘的强大魅力。

目录

第1章 数据挖掘基础2
第2章 Hadoop基础16
第3章 Hadoop生态系统:Hive34
第4章 Hadoop生态系统:HBase46
第5章 大数据挖掘建模平台62
第6章 挖掘建模69
第7章 法律咨询数据分析与服务推荐112
第8章 电商产品评论数据情感分析146
第9章 航空公司客户价值分析170
第10章 基站定位数据商圈分析184
第11章 互联网电影智能推荐196
第12章 家电故障备件储备预测分析204
第13章 市供水混凝投药量控制分析218
第14章 基于图像处理的车辆压双黄线检测240
第15章 基于Mahout的大数据挖掘开发254
第16章 基于TipDM-HB的数据挖掘二次开发272 

下载体验

请输入密码查看内容!

如何获取密码?

 

点击下载