前言
第1章 大数据介绍
1.1 大数据概述
1.1.1 认识大数据
1.1.2 大数据的特征
1.1.3 大数据技术应用与基础
1.2 大数据的意义
1.2.1 大数据的国家战略意义
1.2.2 大数据的企业意义
1.2.3 我国大数据市场的预测
1.3 大数据的产业链分析
1.3.1 技术分析
1.3.2 运营分析
1.4 实训1 用百度指数进行大数据分析
1.5 实训2 确定数据的不同类型
本章小结
习题1
第2章 云计算与大数据
2.1 云计算概述
2.1.1 云计算定义
2.1.2 云计算特征
2.1.3 云计算体系
2.2 云计算的服务类型
2.2.1 IaaS(基础设施即服务)
2.2.2 PaaS(平台即服务)
2.2.3 SaaS(软件即服务)
2.3 云计算的关键技术
2.3.1 虚拟化技术
2.3.2 并行计算技术
2.3.3 分布式存储技术
2.4 云计算与大数据
2.4.1 云计算与大数据的关系
2.4.2 云计算与大数据的结合
2.4.3 云计算的应用
本章小结
习题2
第3章 大数据架构
3.1 大数据架构概述
3.1.1 大数据架构介绍
3.1.2 大数据架构分类
3.2 Hadoop架构
3.2.1 Hadoop介绍
3.2.2 Hadoop发展史
3.2.3 Hadoop核心组件
3.3 HDFS概述
3.3.1 HDFS的概念
3.3.2 HDFS的操作
3.4 MapReduce概述
3.4.1 MapReduce的概念
3.4.2 MapReduce设计方式
3.4.3 MapReduce架构
3.5 实训1 Hadoop搭建
3.6 实训2 MapReduce应用
本章小结
习题3
第4章 数据采集与清洗
4.1 数据采集
4.1.1 数据采集介绍
4.1.2 数据采集平台
4.1.3 网络数据的采集
4.2 数据清洗
4.2.1 数据清洗概述
4.2.2 数据清洗的流程
4.2.3 数据清洗的常用方法
4.2.4 数据标准化概述
4.2.5 数据标准化的实例
4.3 数据仓库概述
4.3.1 数据仓库介绍
4.3.2 数据集成
4.3.3 数据变换
4.3.4 数据仓库的构建工具
4.4 Kettle工具概述
4.5 实训1 使用八爪鱼软件进行网络数据的采集
4.6 实训2 清洗Excel数据
4.7 实训3 清洗异常数据
4.8 实训4 使用Kettle工具进行数据排序
本章小结
习题4
第5章 大数据存储
5.1 大数据存储概述
5.1.1 大数据存储的概念
5.1.2 大数据存储的类型
5.2 大数据存储的方式
5.2.1 分布式存储
5.2.2 NoSQL数据库存储
5.2.3 NewSQL数据库存储
5.2.4 云数据库存储
5.3 大数据中的数据库应用
5.3.1 MySQL
5.3.2 Hive
5.3.3 MongoDB
5.3.4 LevelDB
5.3.5 Neo4j
5.4 实训 查看和购买阿里云RDS服务
本章小结
习题5
第6章 大数据分析与挖掘
6.1 大数据分析概述
6.1.1 大数据分析的概念
6.1.2 大数据分析的类型
6.1.3 大数据分析的内容
6.1.4 大数据分析的方法
6.2 大数据挖掘概述
6.2.1 数据挖掘介绍
6.2.2 数据挖掘应用
6.3 数据挖掘算法
6.3.1 K-Means算法
6.3.2 决策树算法
6.3.3 KNN算法
6.3.4 遗传算法
6.3.5 神经网络算法
6.4 实训 绘制决策树
本章小结
习题6
第7章 大数据可视化
7.1 大数据可视化概述
7.1.1 大数据可视化的概念
7.1.2 大数据可视化的流程
7.1.3 大数据可视化图表
7.2 大数据可视化方法
7.2.1 文本可视化
7.2.2 网络可视化
7.2.3 空间信息可视化
7.3 大数据可视化工具
7.3.1 Excel
7.3.2 ECharts
7.3.3 魔镜
7.4 大数据可视化技术的应用
7.4.1 大数据可视化的应用场景
7.4.2 大数据可视化技术的行业应用
7.5 实训1 阅读并分析大数据可视化图表
7.6 实训2 上网查找大数据可视化资料
7.7 实训3 绘制流程图
7.8 实训4 绘制可视化图表
本章小结
习题7
第8章 大数据安全
8.1 数据安全概述
8.1.1 数据安全的定义
8.1.2 数据安全的特点
8.2 大数据时代的安全挑战与解决
8.2.1 大数据安全面临的主要威胁
8.2.2 大数据安全的关键技术
8.3 实训1 Office文档加密
8.4 实训2 IPC$入侵
本章小结
习题8
第9章 大数据的行业应用
9.1 旅游大数据
9.1.1 旅游大数据的发展
9.1.2 大数据对旅游行业的影响
9.1.3 大数据在旅游行业中的应用
9.1.4 旅游大数据的应用场景
9.1.5 旅游大数据的实现