大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。 大数据技术,是指从各种各样类型的数据中,快速获得有价值信息的能力。 适用于大数据的技术,包括大规模并行处理(MPP)数据库,数据挖掘电网,分布式文件系统,分布式数据库,云计算平台,互联网,和可扩展的存储系统。

本文档主要介绍Hadoop、Hive、Spark、Storm、Flink、HBase、Kafka、Zookeeper、Flume、Sqoop、Azkaban、Scala集成的应用

目录
 

知识兔

前 言
一、Hadoop
二、Hive
三、Spark
四、Storm
五、Flink
六、HBase
七、Kafka
八、Zookeeper
九、Flume
十、Sqoop
十一、Azkaban
十二、Scala
十三、公共内容
后 记 资料分享与开发工具推荐

下载体验

请输入密码查看内容!

如何获取密码?

 

点击下载