译者序
前言
作者简介
审校者简介
第1章 欢迎来到机器人世界1
11 开始你的AI旅程1
12 四种不同的AI模型2
13 学习AI可以让你做什么3
14 小结5
第2章 探索你的AI工具包6
21 GitHub源代码页面6
22 Colaboratory 运行环境7
23 小结11
第3章 Python基础——学习如何用Python编程12
31 显示文本13
32 变量和操作13
33 列表和数组14
34 if语句和条件16
35 for循环和while循环17
36 函数21
37 类和对象22
38 小结24
第4章 AI基础技巧25
41 什么是强化学习25
42 强化学习的五大原理26
421 原理#1——输入与输出系统26
422 原理#2——奖励27
423 原理#3——AI环境27
424 原理#4——马尔可夫决策过程28
425 原理#5——训练与推断28
43 小结30
第5章 你的第一个AI模型——小心老虎机31
51 多臂老虎机问题31
52 汤普森采样模型32
521 模型编程32
522 理解模型36
523 什么是分布37
524 应对多臂老虎机问题39
525 汤普森采样策略三步走41
526 汤普森采样模型的临门一脚42
527 汤普森采样模型与标准模型42
53 小结44
第6章 销售和广告中的AI——像“AI街之狼”一样销售45
61 待解决的问题45
62 用仿真构建AI环境47
621 运行仿真程序48
622 回顾50
63 AI解决方案及其直觉的回顾50
631 AI解决方案51
632 直觉51
64 技术实现52
641 汤普森采样与随机策略选择52
642 开始编程52
643 最终结果57
65 小结58
第7章 欢迎来到Q学习59
71 迷宫59
711 第一步60
712 构建环境61
713 构建AI模型64
72 Q学习的完整流程66
721 训练模式66
722 推断模式67
73 小结67
第8章 物流行业中的AI——仓库中的机器人68
81 构建环境69
811 状态70
812 行为70
813 奖励70
814 AI解决方案回顾70
82 技术实现71
821 第1部分——构建环境72
822 第2部分——用Q学习构建AI解决方案74
823 第3部分——进入推断模式75
824 改进1——自动化奖励分配77
825 改进2——加入一个中间目标80
83 小结82
第9章 人工大脑——深度Q学习83
91 预测房价83
911 上传数据集84
912 导入依赖库85
913 排除变量86
914 准备数据87
915 构建神经网络90
916 训练神经网络91
917 展示结果91
92 深度学习理论92
921 神经元92
922 激活函数95
923 神经网络的工作原理98
924 神经网络如何学习98
925 正向传播算法和反向传播算法99
926 梯度下降算法100
93 深度Q学习106
931 归一化指数方法107
932 深度Q学习回顾108
933 经验回放109
934 深度Q学习的完整算法109
94 小结110
第10章 自动驾驶汽车中的AI——造一辆自动驾驶汽车111
101 构建环境111
1011 设定目标113
1012 设置参数116
1013 输入状态118
1014 输出行为119
1015 奖励120
102 AI解决方案回顾122
103 技术实现123
1031 第1步——导入依赖库123
1032 第2步——创造神经网络的架构124
1033 第3步——实现经验回放127
1034 第4步——实现深度Q学习130
104 演示138
1041 安装Anaconda139
1042 用Python 36创建一个虚拟环境140
1043 安装PyTorch142
1044 安装Kivy143
105 小结151
第11章 商业中的AI——用深度Q学习使成本最小化152
111 要解决的问题152
112 构建环境153
1121 服务器环境中的常量和变量153
1122 关于服务器环境的假设154
1123 仿真155
1124 整体功能156
1125 定义状态157
1126 定义行为158
1127 定义奖励158
1128 最后的仿真示例159
113 AI解决方案161
1131 大脑162
1132 技术实现163
114 演示191
115 回顾——通用AI框架/蓝图199
116 小结200
第12章 深度卷积Q学习201
121 CNN有什么用途201
122 CNN的工作原理202
1221 第1步——卷积204
1222 第2步——最大池化206
1223 第3步——扁平化209
1224 第4步——全连接210
123 深度卷积Q学习211
124 小结212
第13章 游戏中的AI——成为《贪吃蛇》大师213
131 要解决的问题213
132 构建环境214
1321 定义状态214
1322 定义行为215
1323 定义奖励216
133 AI解决方案216
1331 大脑217
1332 经验回放记忆218
134 技术实现219
1341 第1步——构建环境219
1342 第2步——构建大脑226
1343 第3步——构建经验回放记忆228
1344 第4步——训练AI模型230
1345 第5步——测试AI模型235
135 演示237
1351 安装237
1352 结果242
136 小结243
第14章 回顾与总结244
141 回顾——整体AI框架/蓝图244
142 探索你在AI领域的下一站245
1421 不断练习246
1422 社交247
1423 学无止境247