序言 1
前言 3
第1章 Kubeflow及其适用对象 13
1.1 模型开发生命周期 13
1.2 Kubeflow 适合什么场景 14
1.3 为什么需要容器化 14
1.4 为什么需要 Kubernetes 15
1.5 Kubeflow的设计和核心组件 15
1.6 Kubeflow的替代方案 19
1.7 案例研究 21
1.8 总结 22
第2章 你好,Kubeflow 24
2.1 搭建Kubeflow 24
2.2 训练和部署模型 30
2.3 超越本地部署 34
2.4 总结 34
第3章 Kubeflow设计:超越基础 35
3.1 中央仪表盘 36
3.2 支持组件 43
3.3 总结 50
第4章 Kubeflow Pipeline 51
4.1 Pipeline入门 51
4.2 Kubeflow Pipeline组件介绍 60
4.3 Pipeline高级主题 68
4.4 总结 72
第5章 数据准备和特征准备 73
5.1 选择正确的工具 74
5.2 本地数据准备和特征准备 74
5.3 分布式工具 78
5.4 将其整合到一个Pipeline中 92
5.5 将整个notebook作为数据准备Pipeline阶段使用 94
5.6 总结 95
第6章 制品和元数据存储 96
6.1 Kubeflow ML Metadata 97
6.2 基于Kubeflow的MLflow元数据工具 102
6.3 总结 110
第7章 训练机器学习模型 111
7.1 用TensorFlow构建推荐器 111
7.2 部署TensorFlow训练作业 117
7.3 分布式训练 120
7.4 使用scikit-learn训练模型 125
7.5 总结 132
第8章 模型推断 133
8.1 模型服务 133
8.2 模型监控 136
8.3 模型更新 137
8.4 推理要求概述 138
8.5 Kubeflow中的模型推理 138
8.6 TensorFlow Serving 139
8.7 Seldon Core 143
8.8 KFServing 158
8.9 总结 174
第9章 多工具使用案例 175
9.1 CT扫描去噪示例 175
9.2 共享Pipeline 186
9.3 总结 186
第10章 超参调优和自动化机器学习 187
10.1 AutoML概述 187
10.2 使用Kubeflow Katib进行超参调优 188
10.3 Katib概念 189
10.4 安装Katib 191
10.5 运行第一个Katib实验 192
10.6 调优分布式训练作业 200
10.7 神经网络架构搜索 201
10.8 Katib的优势 204
10.9 总结 205
附录A Argo执行器配置和权衡 207
附录B 特定于云的工具和配置 208
附录C 在应用程序中使用模型服务 210