版权声明 iii
前言 v
第 1章 无监督机器学习 1
1.1 主成分分析 1
1.1.1 主成分分析入门 2
1.1.2 应用主成分分析 3
1.2 k均值聚类 5
1.2.1 聚类入门 5
1.2.2 开始聚类分析 6
1.2.3 调整聚类参数 10
1.3 自组织映射 13
1.3.1 自组织映射入门 13
1.3.2 部署自组织映射 14
1.4 扩展阅读 17
1.5 小结 18
第 2章 深度信念网络 19
2.1 神经网络入门 19
2.1.1 神经网络的组成 20
2.1.2 网络拓扑结构 20
2.2 受限玻尔兹曼机 23
2.2.1 受限玻尔兹曼机简介 23
2.2.2 受限玻尔兹曼机的应用 26
2.2.3 受限玻尔兹曼机的扩展应用 35
2.3 深度信念网络 35
2.3.1 训练深度信念网络 36
2.3.2 应用深度信念网络 36
2.3.3 验证深度信念网络 39
2.4 扩展阅读 40
2.5 小结 40
第3章 堆叠式降噪自编码机 41
3.1 自编码机 41
3.1.1 自编码机简介 41
3.1.2 降噪自编码机 43
3.1.3 应用降噪自编码机 44
3.2 堆叠式降噪自编码机 47
3.2.1 应用堆叠式降噪自编码机 48
3.2.2 评估堆叠式降噪自编码机的性能 53
3.3 扩展阅读 54
3.4 小结 54
第4章 卷积神经网络 55
4.1 CNN介绍 55
4.1.1 CNN拓扑结构 56
4.1.2 应用CNN 66
4.2 扩展阅读 71
4.3 小结 71
第5章 半监督学习 72
5.1 简介 72
5.2 何为半监督学习 72
5.3 半监督算法实战 73
5.3.1 自训练 73
5.3.2 对比悲观似然估计 81
5.4 扩展阅读 89
5.5 小结 90
第6章 文本特征工程 91
6.1 介绍 91
6.2 文本特征工程 92
6.2.1 清洗文本数据 92
6.2.2 根据文本数据构造特征 99
6.2.3 测试准备好的数据 103
6.3 扩展阅读 108
6.4 小结 109
第7章 特征工程II 110
7.1 介绍 110
7.2 创建特征集 110
7.2.1 为机器学习应用构建特征 111
7.2.2 运用特征选择技术 117
7.3 特征工程实战 123
7.4 扩展阅读 141
7.5 小结 142
第8章 集成方法 143
8.1 集成简介 143
8.1.1 理解平均集成 144
8.1.2 应用提升法 148
8.1.3 使用堆叠集成 153
8.2 在动态应用中使用模型 157
8.2.1 理解模型稳健性 158
8.2.2 控制模型稳健性的策略 163
8.3 扩展阅读 166
8.4 小结 166
第9章 其他Python机器学习工具 167
9.1 可选的开发工具 167
9.1.1 Lasagne简介 167
9.1.2 TensorFlow简介 169
9.1.3 何时使用这些库 173
9.2 扩展阅读 174
9.3 小结 175
附录 代码运行要求 176