目 录
第1章 大数据概念与应用
1.1 大数据之“大”
1.2 大数据的来源
1.3 大数据的技术支撑
1.4 大数据应用场景
1.5 如何开展大数据研发
习题
参考文献
第2章 数据采集与预处理
2.1 大数据采集架构
2.2 数据预处理原理
2.3 数据仓库与ETL工具
习题
参考文献
第3章 数据挖掘算法
3.1 数据挖掘概述
3.2 分类
3.3 聚类
3.4 关联规则
3.5 预测模型
3.6 数据挖掘算法综合应用
习题
参考文献
第4章 大数据挖掘工具
4.1 Mahout
4.2 Spark MLlib
4.3 其他数据挖掘工具
习题
参考文献
第5章 R语言
5.1 R语言简介
5.2 R与数据挖掘
5.3 SparkR
习题
参考文献
第6章 大数据可视化
6.1 数据可视化基础
6.2 大数据可视化方法
6.3 大数据可视化软件与工具
习题
参考文献
第7章 互联网大数据处理
7.1 互联网信息抓取
7.2 文本分词
7.3 倒排索引
7.4 网页排序算法
7.5 历史信息检索
习题
参考文献
第8章 大数据商业应用
8.1 用户画像与精准营销
8.2 广告推荐
8.3 互联网金融
习题
参考文献
第9章 行业大数据
9.1 地震大数据
9.2 交通大数据
9.3 环境大数据
9.4 警务大数据
习题
参考文献
附录:大数据实验一体机