第1章 大数据的产生发展
1.1 互联网和物联网上的数据
1.2 大数据的使用
1.3 数据挖掘中的一些概念
1.4 数据仓库
第2章 Hadoop概述
2.1 Hadoop的起源发展
2.2 Hadoop核心基础架构
2.3 Hadoop上的各组件
2.4 Spark和Hadoop
第3章 MapReduce的工作机制
3.1 剖析MapReduce作业运行机制
3.2 程序运行失败分析
3.3 shuffle和排序
3.4 任务的执行
第4章 MapReduce的类型格式与特征
4.1 MapReduce的类型
4.2 输入输出格式
4.3 MapReduce的特性
第5章 Hadoop分布式文件系统
5.1 HDFS的设计与概念
5.2 Hadoop文件系统
5.3 数据接口的分析
5.4 剖析文件数据流
5.5 通过distcp并行复制分析
第6章 Hadoop生态系统
6.1 Hive简介分析
6.2 Hive原理与架构
6.3 HBase简介分析
6.4 HBase原理与架构
第7章 管理Hadoop
7.1 HDFS的分析
7.2 监控日志
7.3 日常管理维护
第8章 Hadoop安全
8.1 安全的核心
8.2 Hadoop中的认证安全
8.3 Hadoop中的授权安全
8.4 Hadoop中的数据保密性
8.5 Hadoop中的日志审计
第9章 使用Hadoop进行数据分析
9.1 数据分析工作流
9.2 机器学习
9.3 Apache Mahout
9.4 使用Hadoop和Mahout进行文档分析
第10章 Hadoop在互联网公司的应用
10.1 Hadoop在腾讯的应用
10.2 Hadoop在Facebook的应用
10.3 金山的Hadoop应用
10.4 迅雷公司对Hadoop的应用
第11章 Hadoop和行业应用的结合应用
11.1 Hadoop和运营商的结合
11.2 Hadoop和公用事业的结合
11.3 Hadoop和“智慧工商”的结合
11.4 Hadoop和金融的结合
11.5 Hadoop和医疗的结合
11.6 Hadoop和物流的结合
11.7 Hadoop和媒体的结合
参考文献