《Python深度强化学习入门:强化学习和深度学习的搜索与控制》共7章。第1章介绍了机器学习的分类、强化学习的学习机制以及深度强化学习的概念;第2章通过强化学习的基本概念、马尔可夫决策过程和贝尔曼方程、贝尔曼方程的求解方法、无模型控制等介绍了强化学习的基本算法;第3章通过深度学习、卷积神经网络(CNN)、循环神经网络(RNN)介绍了强化学习中深度学习的特征提取方法;第4章通过行动价值函数的网络表示、策略函数的网络表示介绍了深度强化学习的实现;第5章通过策略梯度法的连续控制、学习算法和策略模型等,详细介绍了深度强化学习在连续控制问题中的应用及具体实现;第6章通过巡回推销员问题和魔方问题详细介绍了深度强化学习在组合优化中的应用及具体实现;第7章通过SeqGAN的文本生成和神经网络架构的搜索详细介绍了深度强化学习在时间序列数据生成的应用。在附录中还给出了Colaboratory和Docker等深度强化学习开发环境的构建。