注册 | 登录读书好,好读书,读好书!
读书网-DuShu.com
当前位置: 首页出版图书科学技术计算机/网络人工智能深度学习:从神经网络到深度强化学习的演进

深度学习:从神经网络到深度强化学习的演进

深度学习:从神经网络到深度强化学习的演进

定 价:¥89.00

作 者: 魏翼飞,汪昭颖,李骏 著
出版社: 清华大学出版社
丛编项:
标 签: 暂缺

购买这本书可以去


ISBN: 9787302562047 出版时间: 2021-01-01 包装: 平装
开本: 16 页数: 352 字数:  

内容简介

  本书首先概述人工智能、深度学习相关的基本概念和发展历程;然后详细介绍深度学习的基本理论和算法,包括神经网络的关键技术、卷积神经网络的主要框架和应用实例、循环神经网络和无监督学习深度神经网络的模型和应用、深层神经网络的参数优化方法、深度学习模型的轻量化方案以及移动端深度学习案例;之后阐述强化学习的基本理论和算法,包括传统的强化学习方法及其衍生算法以及新型的多智能体或多任务学习模型;最后介绍深度强化学习的具体算法及应用、迁移学习的概念及其在深度学习和强化学习中的应用。本书可作为学习深度学习及强化学习算法的参考书,也可作为高等院校相关课程的教材,还可供从事人工智能领域的专业研究人员和工程技术人员阅读。

作者简介

  魏翼飞北京邮电大学教授,博士生导师。加拿大卡尔顿大学联合培养博士,爱尔兰都柏林城市大学博士后,北京邮电大学理学院副院长(2014—2016年),美国休斯顿大学访问学者(2016—2017年)。目前主要研究深度学习、强化学习及区块链技术。作为负责人先后主持3项国家自然科学基金项目,参与完成了3项国家科技重大专项、2项国家科技支撑计划项目。在国内外学术期刊上发表SCI检索论文20余篇,EI检索论文30余篇,申请专利30余项。 汪昭颖北京邮电大学博士研究生,目前主要研究方向为深度学习、强化学习、边缘计算等技术。 李 骏江苏省科技企业家(2018届),视觉检测专家。曾主持研发多个轨道交通视觉检测系统。先后获得中国铁道学会科学技术奖二等奖及三等奖各1项、北京市科学技术二等奖、上海市科学技术一等奖等奖项,已获得授权专利80余项。目前主要研究方向涵盖光电检测系统、高速3D重构、多维数据融合、深度学习等。

图书目录

目录





第1章人工智能与深度学习概述

1.1人工智能与机器学习

1.1.1人工智能的发展历程

1.1.2机器学习及深度学习的发展历程

1.1.3人工智能与机器学习及深度学习的关系

1.2机器学习的分类

1.2.1监督学习

1.2.2非监督学习

1.2.3半监督学习

1.2.4强化学习

1.2.5其他分类方式

1.3深度学习的分类及发展趋势

1.3.1深度神经网络

1.3.2卷积神经网络

1.3.3其他深度神经网络

1.3.4深度学习的发展趋势

1.4深度学习与强化学习的结合

1.4.1强化学习

1.4.2强化学习算法分类

1.4.3深度强化学习

本章小结

第2章神经网络与深度学习

2.1深度学习简介

2.1.1传统机器学习算法与深度学习算法对比

2.1.2深度学习发展历程

2.2图像分类问题

2.2.1KNN分类器

2.2.2线性分类器

2.2.3损失及优化

2.3损失函数

2.3.1折页损失函数

2.3.2交叉熵损失函数

2.4反向传播算法

2.4.1计算图

2.4.2反向传播举例

2.5人工神经网络

2.5.1神经网络的结构

2.5.2神经网络的分类

2.6激活函数

2.6.1常用激活函数

2.6.2各种激活函数的优缺点

本章小结

第3章卷积神经网络

3.1基本概念

3.1.1卷积

3.1.2池化

3.1.3经典网络LeNet5

3.2几种卷积神经网络介绍

3.2.1AlexNet

3.2.2VGGNet

3.2.3NIN

3.2.4GoogLeNet

3.2.5ResNet

3.3计算机视觉问题

3.3.1图像分类

3.3.2目标定位

3.3.3目标检测

3.3.4图像分割

3.4深度学习应用实例

3.4.1深度学习框架

3.4.2MNIST手写数字识别

3.4.3基于DeepLabV3+模型的轨道图像分割

本章小结

第4章循环神经网络及其他深层神经网络

4.1从DNN到RNN

4.1.1RNN结构

4.1.2深度 RNN

4.1.3RNN的训练

4.2RNN变体

4.2.1LSTM

4.2.2GRU

4.2.3其他结构

4.3RNN应用举例

4.3.1时序数据预测

4.3.2自然语言处理

4.4自编码器

4.4.1稀疏自编码器

4.4.2去噪自编码器

4.4.3压缩自编码器

4.5深度生成式模型

4.5.1全可见信念网络

4.5.2变分自编码器

4.5.3生成式对抗网络

本章小结

第5章深层神经网络的训练方法

5.1参数更新方法

5.1.1梯度下降算法的问题

5.1.2基于动量的更新

5.1.3二阶优化方法

5.1.4共轭梯度

5.1.5拟牛顿法

5.2自适应学习率算法

5.2.1学习率衰减

5.2.2AdaGrad算法

5.2.3RMSProp算法

5.2.4AdaDelta算法

5.2.5Adam算法

5.2.6几种常见优化算法的比较

5.3参数初始化

5.3.1合理初始化的重要性

5.3.2随机初始化

5.3.3Xavier初始化

5.3.4He初始化

5.3.5批量归一化

5.3.6预训练

5.4网络正则化

5.4.1正则化的目的

5.4.2L1和L2正则化

5.4.3权重衰减

5.4.4提前停止

5.4.5数据增强

5.4.6丢弃法

5.4.7标签平滑

5.5训练深层神经网络的小技巧

5.5.1数据预处理

5.5.2超参数调优

5.5.3集成学习

5.5.4监视训练过程

本章小结

第6章轻量化神经网络模型

6.1深度学习轻量化模型

6.1.1SqueezeNet模型

6.1.2MobileNet模型

6.1.3ShuffleNet模型

6.1.4Xception模型

6.2深度神经网络模型压缩

6.2.1推理阶段的压缩算法

6.2.2训练阶段的压缩算法

6.3深度神经网络的硬件加速

6.3.1推理阶段的硬件加速

6.3.2训练阶段的硬件加速

6.4移动端深度学习

6.4.1移动端深度学习概述

6.4.2移动端深度学习框架

6.4.3移动端深度学习示例

本章小结

第7章强化学习算法

7.1强化学习综述

7.1.1目标、单步奖励与累积回报

7.1.2马尔可夫决策过程

7.1.3值函数与最优值函数

7.2动态规划方法

7.2.1策略迭代

7.2.2值迭代

7.3基于值函数的强化学习算法

7.3.1基于蒙特卡罗的强化学习算法

7.3.2基于时间差分的强化学习算法

7.3.3TDλ算法

7.4基于策略梯度的强化学习算法

7.4.1何时应用基于策略的学习方法

7.4.2策略梯度详解

7.4.3蒙特卡罗策略梯度算法

7.4.4ActorCritic算法

7.5值函数近似和衍生算法

7.5.1值函数近似

7.5.2基于值函数近似的TD方法

7.5.3基于线性值函数近似的GTD方法

7.5.4OffPolicy ActorCritic算法

本章小结

第8章多智能体多任务学习

8.1多智能体学习

8.1.1多智能体强化学习背景

8.1.2多智能体强化学习任务分类及算法介绍

8.1.3多智能体增强学习平台

8.2多任务学习

8.2.1多任务学习的背景与定义

8.2.2多任务监督学习

8.2.3其他多任务学习

8.2.4多任务学习的应用

8.3元学习

8.3.1从模型评估中学习

8.3.2从任务特征中学习

8.4联邦学习

8.4.1背景

8.4.2联邦学习的特点及优势

8.4.3联邦学习的分类

8.4.4联邦学习的应用

本章小结

第9章深度强化学习

9.1基于值函数的深度强化学习

9.1.1深度Q学习

9.1.2深度Q学习的衍生方法

9.2基于策略梯度的深度强化学习

9.2.1深度确定性策略梯度算法

9.2.2异步深度强化学习算法

9.2.3信赖域策略优化及其衍生算法

9.3深度强化学习的应用

9.3.1计算机围棋程序AlphaGo

9.3.2深度强化学习的其他应用

9.3.3深度强化学习在通信网络中的应用

本章小结

第10章迁移学习

10.1迁移学习简介及分类

10.1.1迁移学习概述

10.1.2迁移学习的分类

10.2迁移学习的应用

10.2.1迁移学习在深度学习中的应用

10.2.2迁移学习在强化学习中的应用

本章小结

附录A最近邻算法实现代码

附录BTensorFlow训练LeNet5网络实现代码

附录C基于DeepLabv3+模型的轨道图像分割

附录D时序数据预测实现代码

附录E自然语言处理实现代码

附录F移动端深度学习示例

参考文献

本目录推荐