Python深度强化学习入门：强化学习和深度学习的搜索与控制

定　价：¥89.00

作　者：	（日）伊藤多一，今津义充，须藤广大，仁平将人，川崎悠介等
出版社：	机械工业出版社
丛编项：
标　签：	暂缺

购买这本书可以去

ISBN：	9787111700722	出版时间：	2022-04-01	包装：
开本：	16开	页数：	239	字数：

内容简介

　　《Python深度强化学习入门：强化学习和深度学习的搜索与控制》共7章。第1章介绍了机器学习的分类、强化学习的学习机制以及深度强化学习的概念；第2章通过强化学习的基本概念、马尔可夫决策过程和贝尔曼方程、贝尔曼方程的求解方法、无模型控制等介绍了强化学习的基本算法；第3章通过深度学习、卷积神经网络（CNN）、循环神经网络（RNN）介绍了强化学习中深度学习的特征提取方法；第4章通过行动价值函数的网络表示、策略函数的网络表示介绍了深度强化学习的实现；第5章通过策略梯度法的连续控制、学习算法和策略模型等，详细介绍了深度强化学习在连续控制问题中的应用及具体实现；第6章通过巡回推销员问题和魔方问题详细介绍了深度强化学习在组合优化中的应用及具体实现；第7章通过SeqGAN的文本生成和神经网络架构的搜索详细介绍了深度强化学习在时间序列数据生成的应用。在附录中还给出了Colaboratory和Docker等深度强化学习开发环境的构建。

作者简介

　　[日]伊藤多一，1995年在名古屋大学理学研究所完成博士课程，井获得博士学位。后一直从事粒子物理学研究，直到2004年3月。同年，加入了一家专门从事合同数据分析的风险公司，井参与了多个数据分析项目。自2013年以来，他一直在BrainPad公司从事机器学习的广告效果分析工作。自2016年以来，通过深度学习参与了图像分析项目。今津义充，博士学位（理学），熟悉统计分析、模型构建以及基于数值分析的基本粒子和核物理研究。自2013年以来，领导了BrainPad公司的定量分析项目，例如需求预测和数学优化等。近年来，一直从事利用深度学习技术的项目分析和应用研究。须藤广大，在奈良科学技术学院主修自然语言处理，获得硕士学位（信息工程）。后以新毕业生的身份加入BrainPad公司，井以机器学习工程师的身份从事与深度学习相关的项目分析和开发。仁平将人，硕士学位，在研究生院主修管理系统工程专业，于2018年加入BrainPad公司成为数据科学家。加入公司后，从事有关强化学习和自然语言处理的项目。川崎悠介，硕士学位，大学期间主修信息工程，并于2018年加入BrainPad公司。从事图像识别和时间序列预测的相关项目研究。