第1章 绪论
1.1 什么是大数据
1.2 大数据的特征
1.3 大数据分析的发展情况
1.4 大数据的相关政策
第2章 面向大数据的分布式存储系统
2.1 Bigtable
2.1.1 Bigtable构件
2.1.2 Bigtable实现
2.1.3 Tablet
2.1.4 Bigtable优化
2.1.5 Bigtable性能
2.1.6 实际应用
2.2 Google File System
2.2.1 GFS框架
2.2.2 Master节点
2.2.3 Chunk数据块
2.2.4 元数据
2.2.5 系统交互
2.2.6 容错和诊断
2.3 Dynamo
2.3.1 系统架构
2.3.2 系统实现
2.3.3 故障处理
2.4 小结
第3章 面向大数据的分布式处理框架
3.1 Hadoop
3.1.1 概述
3.1.2 实现运行
3.1.3 实际应用
3.2 MapReduce
3.2.1 MapReduce实现
3.2.2 MapReduce的实际应用
3.3 Spark
3.3.1 概述
3.3.2 RDD
3.3.3 Spark处理框架
3.3.4 Spark在实际中的应用
3.4 小结
第4章 面向大数据信息挖掘的算法
4.1 C4.5
4.1.1 算法描述
4.1.2 算法特性
4.1.3 软件实现
4.1.4 应用示例
4.1.5 相关研究
4.1.6 小结
4.2 k-means
4.2.1 算法描述
4.2.2 软件实现
4.2.3 应用示例
4.2.4 相关研究
4.2.5 小结
4.3 支持向量机
4.3.1 支持向量分类器
4.3.2 支持向量分类器的软间隔优化
4.3.3 核技巧
4.3.4 理论基础
4.3.5 支持向量回归器
4.3.6 软件实现
4.3.7 相关研究
4.3.8 小结
4.4 Apriori
4.4.1 算法描述
4.4.2 挖掘序列模式
4.4.3 软件实现
4.4.4 应用示例
4.4.5 相关研究
4.4.6 小结
4.5 EM
4.5.1 引言
4.5.2 算法描述
4.5.3 软件实现
4.5.4 应用示例
4.5.5 相关研究
4.5.6 小结
4.6 PageRank
4.6.1 算法描述
4.6.2 扩展:Timed-PageRank
4.6.3 小结
4.7 AdaBoost
4.7.1 算法描述
4.7.2 软件实现
4.7.3 应用示例
4.7.4 相关研究
4.7.5 小结
4.8 k最近邻
4.8.1 算法描述
4.8.2 软件实现
4.8.3 相关研究
4.8.4 小结
4.9 Naive Bayes
4.9.1 算法描述
4.9.2 独立变量
4.9.3 模型扩展
4.9.4 软件实现
4.9.5 应用示例
4.9.6 相关研究
4.9.7 小结
4.10 分类和回归树算法
4.10.1 算法描述
4.10.2 深度讨论
4.10.3 软件实现
4.10.4 相关研究
4.10.5 小结
第5章 数据可视化
5.1 基本可视化图表
5.2 示例
5.2.1 全国就业和薪酬分析
5.2.22015年国内外搜索分析
5.3 可视化工具
5.4 D3.js
5.4.1 简介
5.4.2 搭建一个简易的D3开发环境
5.4.3 如何深入学习D3.js
第6章 大数据与人工智能
6.1 什么是深度学习
6.2 深度学习主流模型介绍
6.2.1 卷积神经网络
6.2.2 循环神经网络
6.3 深度学习实例
6.3.1 深度学习主流工具介绍
6.3.2 利用CNN模型识别MNIST手写数字数据集
6.3.3 利用RNN模型识别MNIST手写数字数据集
6.3.4 分布式深度学习
6.3.5 分布式深度学习实例
第7章 实践案例
7.1 云计算技术
7.1.1 服务模式
7.1.2 部署模型
7.2 公安智能大数据平台
7.2.1 背景
7.2.2 智能大数据平台架构
7.2.3 智能大数据平台功能介绍
7.3 交警智能大数据平台
7.3.1 交警智能大数据平台框架
7.3.2 交警智能大数据平台技术框架
7.3.3 功能展示
参考文献
附录 促进大数据发展行动纲要