第1章 引言
1.1 数据科学与人工智能时代
1.2 数据智慧
1.3 本书内容安排
第2章 基础模型
2.1 机器学习方法
2.1.1 双向聚类
2.1.2 基于邻居的 算法
2.1.3 网络模型
2.2 深度学习
2.2.1 机器翻译模型
2.2.2 图像分析模型
第3章 音乐风格识别
3.1 背景介绍
3.2 方法简介
3.2.1 音频数据和音频特征
3.2.2 混合动力模型架构
3.3 描述分析
3.3.1 数据来源及简介
3.3.2 数据加工
3.3.3 音频特征提取
3.4 混合动力模型架构
3.4.1 两个基础模型的预测效果
3.4.2 混合动力模型架构的预测效果
3.4.3 工程优化
第4章 航空数据案例分析
4.1 数据简介
4.2 单机实现
4.2.1 基于Mysql的数据预处理
4.2.2 洛杉矶到波士顿航线的延误分析
4.2.3 机场聚类分析
4.2.4 短路径
4.3 分布式实现
4.3.1 基于Hive的数据预处理
4.3.2 用Spark建立分类模型
第5章 公共自行车数据案例分析
5.1 数据简介
5.1.1 交易流水表
5.1.2 纽约市天气数据
5.2 单机实现
5.2.1 描述统计分析与可视化展现
5.2.2 自行车角度的分析
5.2.3 单个站点借车量预测分析
5.3 分布式实现
5.3.1 数据预处理与描述统计
5.3.2 分布式预测模型
第6章 机器翻译实例
6.1 数据简介与数据预处理
6.1.1 删除异常值
6.1.2 修改异常值及数据筛选