第1章 聚类
1.1 简介
1.2 无监督学习与有监督学习
1.3 聚类的识别
1.3.1 识别聚类
1.3.2 二维数据
1.3.3 练习1:识别数据中的聚类
1.4 关于k均值聚类
1.4.1 无数学k均值演练
1.4.2 对于k均值聚类的深度演练
1.4.3 替代距离度量——曼哈顿距离
1.4.4 更深的维度
1.4.5 练习2:用Python计算欧几里得距离
1.4.6 练习3:以距离的概念形成聚类
1.4.7 练习4:从头开始实现k均值
1.4.8 练习5:通过优化实现k均值
1.4.9 聚类性能:轮廓分数
1.4.10 练习6:计算轮廓分数
1.4.11 活动1:实现k均值聚类
1.5 小结
第2章 分层聚类
2.1 介绍
2.2 聚类刷新
2.3 分层的组织结构
2.4 分层聚类简介
2.4.1 执行分层聚类的步骤
2.4.2 分层聚类的演练示例
2.4.3 练习7:建立分层结构
2.5 链接
2.5.1 链接概述
2.5.2 活动2:应用链接标准
2.6 凝聚分层聚类与分裂分层聚类
2.6.1 练习8:使用scikit-learn实现凝聚分层聚类
2.6.2 活动3:比较k均值和分层聚类
2.7 关于k均值与分层聚类
2.8 小结
第3章 邻域聚类方法和DBSCAN
3.1 介绍
3.1.1 聚类方法
3.1.2 作为邻域的聚类
3.2 关于DBSCAN
3.2.1 DBSCAN深度
3.2.2 DBSCAN算法的演练
3.2.3 练习9:评估邻域半径大小的影响
3.2.4 DBSCAN属性——邻域半径
3.2.5 活动4:从头开始实现DBSCAN
3.2.6 DBSCAN属性——最少点
3.2.7 练习10:评估最少点阈值的影响
3.2.8 活动5:比较DBSCAN与k均值和分层聚类
3.3 DBSCAN与k均值和分层聚类
3.4 小结
第4章 降维和PCA
4.1 介绍
4.1.1 降维的定义
4.1.2 降维的应用
4.1.3 维数的诅咒
4.2 降维技术
4.2.1 概述
……
第5章 自动编码器
第6章 t分布随机邻域嵌入算法
第7章 主题建模
第8章 购物篮分析
第9章 热点分析
附录