目录
“智能科学技术著作丛书”序
前言
第1章 绪论 1
1.1 引言.1
1.2 智能博弈对抗内涵与意义 2
1.2.1 智能博弈对抗 2
1.2.2 相关概念 2
1.2.3 研究的意义 6
1.3 智能博弈对抗相关研究应用 7
1.3.1 即时策略类对抗 7
1.3.2 序贯策略类对抗 10
1.3.3 军事仿真类对抗 15
1.4 主要内容及章 节安排 19
参考文献 21
第2章 博弈论视角下的多智能体学习 23
2.1 引言 23
2.2 博弈论基础 23
2.2.1 博弈五要素 24
2.2.2 博弈论分类 25
2.2.3 博弈论相关概念 26
2.3 多智能体学习简介 27
2.3.1 多智能体学习系统组成 28
2.3.2 多智能体学习概述 29
2.3.3 多智能体学习研究方法分类 30
2.4 多智能体博弈学习框架 31
2.4.1 多智能体博弈基础模型及元博弈 31
2.4.2 均衡解概念与博弈动力学 34
2.4.3 多智能体博弈学习的挑战 36
2.5 多智能体博弈策略学习方法.39
2.5.1 离线博弈策略学习方法 40
2.5.2 在线博弈策略学习方法 49
2.6 前沿研究重点及方向 50
2.6.1 前沿研究重点 50
2.6.2 前沿研究方向 51
参考文献 52
第3章 智能博弈对抗策略学习方法基础 65
3.1 引言 65
3.2 马尔可夫决策过程 65
3.2.1 马尔可夫决策模型 65
3.2.2 马尔可夫决策过程求解方法 67
3.2.3 半马尔可夫决策过程 70
3.3 强化学习 75
3.3.1 强化学习简介 76
3.3.2 基于值函数的方法 78
3.3.3 基于策略梯度的方法 80
3.4 深度强化学习 81
3.4.1 无模型强化学习 81
3.4.2 基于模型的强化学习 84
3.5 分层强化学习 86
3.6 分布式强化学习 88
参考文献 91
第4章 智能博弈对抗对手建模方法 95
4.1 引言 95
4.2 对手建模基础 95
4.2.1 对手建模简介 95
4.2.2 显式对手建模方法 98
4.2.3 隐式对手建模方法 99
4.3 面向即时策略类对抗的对抗规划 100
4.3.1 战术对抗规划 100
4.3.2 策略对抗规划 103
4.3.3 混合对抗规划 106
4.3.4 未来研究重点 109
4.4 面向序贯策略类对抗的对手剥削 110
4.4.1 对手建模式适变 111
4.4.2 对手感知式学习 113
4.4.3 对手生成式搜索 114
4.4.4 未来研究重点 115
参考文献 116
第5章 协作式即时策略博弈对抗决策智能体设计 123
5.1 引言 123
5.2 面向《星际争霸》的即时策略博弈对抗决策 123
5.2.1 《星际争霸》游戏基础 123
5.2.2 问题复杂度分析 125
5.2.3 研究挑战 125
5.2.4 关键技术分析 126
5.3 《星际争霸》智能博弈AI构建 135
5.3.1 《星际争霸》AI研究历程 135
5.3.2 《星际争霸》AI环境 138
5.3.3 《星际争霸》AI实现 139
参考文献 142
第6章 竞争式序贯博弈对抗决策智能体设计 144
6.1 引言 144
6.2 面向德州扑克的序贯博弈对抗决策 144
6.2.1 无限注德州扑克规则 144
6.2.2 问题复杂度分析 147
6.2.3 关键技术分析 148
6.3 德州扑克智能博弈AI构建 155
6.3.1 德州扑克AI研究历程 155
6.3.2 德州扑克智能博弈系统 160
6.3.3 两人无限注德州扑克AI实现 162
6.3.4 多人无限注德州扑克AI实现 165
参考文献 166
第7章 混合式序贯博弈对抗决策智能体设计 169
7.1 引言 169
7.2 面向斗地主的序贯博弈对抗决策 169
7.2.1 斗地主规则 169
7.2.2 问题复杂度分析 170
7.2.3 关键技术分析 171
7.3 斗地主智能博弈AI构建 177
7.3.1 斗地主AI研究历程 177
7.3.2 斗地主AI实现 178
7.4 面向桥牌的序贯博弈对抗决策 180
7.4.1 桥牌规则 180
7.4.2 问题复杂度分析 181
7.4.3 关键技术分析 182
7.5 桥牌叫牌AI构建 187
7.5.1 桥牌AI研究历程 187
7.5.2 叫牌AI实现 188
参考文献 190
第8章 兵棋智能博弈对抗决策智能体设计192
8.1 引言 192
8.2 面向智能兵棋的多智能体对抗决策方法 192
8.2.1 兵棋推演基础 192
8.2.2 问题复杂度分析 194
8.2.3 关键技术分析 196
8.3 墨子兵棋AI构建 206
8.3.1 兵棋AI研究历程206
8.3.2 兵棋智能博弈系统 207
8.3.3 兵棋AI实现 208
参考文献 212
第9章 智能博弈对抗元理论 214
9.1 引言 214
9.2 元宇宙:开放式学习环境 214
9.3 元博弈:博弈的博弈理论 217
9.3.1 元博弈理论 217
9.3.2 开放式学习框架 218
9.4 元认知:认知行为框架 218
9.4.1 快与慢 218
9.4.2 元认知 219
9.4.3 认知行为建模 220
9.5 元学习:双层优化方法 222
9.5.1 度量学习方法 222
9.5.2 分层优化方法 223
9.5.3 贝叶斯方法 224
参考文献.224
第10章 智能博弈对抗前沿应用227
10.1 引言.227
10.2 微分博弈与视觉欺骗227
10.2.1 微分博弈 227
10.2.2 视觉欺骗 228
10.3 攻防博弈与复杂网络攻防 232
10.3.1 攻防博弈 232
10.3.2 复杂网络攻防 233
10.4 平均场博弈与无人机集群对抗 234
10.4.1 平均场博弈 234
10.4.2 无人机集群对抗 235
参考文献 238