第1章 排序 1
1.1 研究动因:谷歌问题 1
1.2 研究结果 4
1.2.1 Perron-Frobenius定理 4
1.2.2 PageRank 8
1.3 案例研究:品牌忠诚度 14
1.4 练习 17
第2章 在线学习 19
2.1 研究动因:投资组合选择 19
2.2 研究结果 22
2.2.1 在线镜像下降 22
2.2.2 熵设定 29
2.3 案例分析:专家建议 33
2.4 练习 34
第3章 推荐系统 37
3.1 研究动因:Netflix大赛 37
3.2 研究结果 38
3.2.1 基于近邻的方法 38
3.2.2 基于模型的方法 41
3.3 案例分析:潜在语义分析 52
3.4 练习 54
第4章 分类 56
4.1 研究动因:信用调查 56
4.2 研究结果 57
4.2.1 Fisher判别规则 57
4.2.2 支持向量机 64
4.3 案例分析:质量控制 72
4.4 练习 74
第5章 聚类 77
5.1 研究动因:DNA测序 77
5.2 研究结果 79
5.2.1 k-均值算法 79
5.2.2 谱聚类 82
5.3 案例分析:主题抽取 88
5.4 练习 91
第6章 线性回归 93
6.1 研究动因:计量经济学分析 93
6.2 研究结果 95
6.2.1 最小二乘法 95
6.2.2 岭回归 102
6.3 案例分析:资本资产定价 107
6.4 练习 109
第7章 稀疏恢复 112
7.1 研究动因:变量选择 112
7.2 研究结果 114
7.2.1 Lasso回归 114
7.2.2 迭代阈值收缩算法 119
7.3 案例分析:压缩感知 124
7.4 练习 126
第8章 神经网络 127
8.1 研究动因:神经细胞 127
8.2 研究结果 129
8.2.1 逻辑回归 129
8.2.2 感知机 135
8.3 案例分析:垃圾邮件过滤 140
8.4 练习 143
第9章 决策树 145
9.1 研究动因:泰坦尼克号幸存率 145
9.2 研究结果 148
9.2.1 NP完全性 148
9.2.2 自上而下的和自下而上的启发式算法 154
9.3 案例研究:国际象棋引擎 157
9.4 练习 160
第10章 练习题解 163
10.1 排序 163
10.2 在线学习 169
10.3 推荐系统 174
10.4 分类 182
10.5 聚类 189
10.6 线性回归 198
10.7 稀疏恢复 205
10.8 神经网络 210
10.9 决策树 216
参考文献 228
索引 231
英文索引 236