第1章 大规模机器学习:引言
1.1 机器学习基础
1.2 大规模机器学习的缘由
1.2.1 大量的数据实例
1.2.2 高输入维数
1.2.3 模型和算法的复杂性
1.2.4 对推断时间的约束
1.2.5 预测串
1.2.6 模型选择和参数搜索
1.3 在并行分布式计算中的关键概念
1.3.1 数据并行化
1.3.2 任务并行化
1.4 平台的选择和折中
1.5 性能方面的考虑
1.6 本书的组织结构
1.6.1 第一部分:大规模机器学习的框架
1.6.2 第二部分:监督和非监督学习算法
1.6.3 第三部分:可替代的学习环境
1.6.4 第四部分:应用
1.7 文献注解
参考文献
第一部分 大规模机器学习的框架
第2章 MapReduce及其在决策树集的大规模并行学习中的应用
2.1 序言
2.1.1 MapReduce
2.1.2 树模型
2.1.3 树模型的学习
2.1.4 回归树
2.2 PLANET的例子
2.2.1 组成元素
2.2.2 继续讨论本例子
2.3 技术细节
2.3.1 MR_Expand节点:扩展单一节点
2.3.2 MR_InMemory:内存中的树归纳
2.3.3 控制器的设计
2.4 集成学习
2.5 工程方面的问题
2.5.1 提前调度
2.5.2 指纹法
2.5.3 可靠性
2.6 试验
2.6.1 设置
2.6.2 结果
2.7 相关工作
2.8 结论
致谢
参考文献
……
第二部分 监督和非监督学习算法
第三部分 其他的学习算法
第四部分 应用