目录
前言
第1章 概论 1
1.1 任务简述 1
1.2 发展历程 3
1.2.1 早期 3
1.2.2 近期 4
1.2.3当代 5
1.3 任务定义及分类 6
1.3.1 形式化定义 6
1.3.2 任务分类 6
1.3.3 相关任务辨析 11
1.4 模型评测 12
1.4.1 评价指标 12
1.4.2 代表性数据集 16
1.5 典型应用 25
1.5.1 搜索引擎增强 25
1.5.2 智能助理 27
1.6 本章小结 27
第2章 深度学习基础 28
2.1 多层感知机 28
2.1.1 感知机 28
2.1.2 多层感知机 34
2.1.3 分析总结 39
2.2 表示学习初探 44
2.2.1 文本的稀疏表示 44
2.2.2 文本的分布式表示 45
2.2.3 分析总结 50
2.3 卷积神经网络 51
2.4 循环神经网络及其改进 53
2.5 注意力机制 57
2.6 再论表示学习 59
2.6.1 CoVe 59
2.6.2 ELMo 60
2.6.3 GPT 62
2.6.4 BERT 64
2.7 本章小结 66
第3章 基本框架 67
3.1 基本框架 67
3.2 嵌入编码 69
3.2.1 传统编码方法 70
3.2.2 预训练的基于上下文的编码方法 70
3.2.3 多粒度编码 72
3.3 特征提取 73
3.3.1 基于循环神经网络的特征提取 73
3.3.2 基于卷积神经网络的特征提取 75
3.3.3 基于多头自注意力的特征提取 76
3.4 文章-问题交互 76
3.4.1 单向注意力 76
3.4.2 双向注意力 77
3.4.3 一次交互 79
3.4.4 多次交互 79
3.5 答案预测 81
3.5.1 答案在文章 中 81
3.5.2 答案不在文章 中 83
3.6 其他方法 84
3.6.1 强化学习 84
3.6.2 答案排序 85
3.6.3 句子选择 85
3.7 本章小结 85
第4章 代表性模型 86
4.1 Match-LSTM:基于指针网络的边界模型 86
4.2 R-NET:自注意力门控机制 88
4.3 Bi-DAF:双向注意力流 90
4.4 QANet:基于Transformer结构的阅读理解模型 92
4.5 R.M-Reader 94
4.6 S-Net 97
4.7 基于双向自注意力的预训练语言模型 100
4.8 代表性方法比较分析 100
4.9 本章小结 101
第5章 新兴趋势 103
5.1 引入知识的机器阅读理解 103
5.1.1 任务定义 103
5.1.2 代表数据集 103
5.1.3 存在的挑战 104
5.1.4 现有方法 104
5.2 带有不能回答问题的机器阅读理解 105
5.2.1 任务定义 105
5.2.2 代表数据集 106
5.2.3 存在的挑战 106
5.2.4 现有方法 106
5.3 多文档机器阅读理解 107
5.3.1 任务定义 107
5.3.2 代表数据集 108
5.3.3 存在的挑战 108
5.3.4 现有方法 109
5.4 对话式机器阅读理解 111
5.4.1 任务定义 111
5.4.2 代表数据集 111
5.4.3 存在的挑战 112
5.4.4 现有方法 113
5.5 跨语言机器阅读理解 114
5.5.1 任务定义 114
5.5.2 代表数据集 114
5.5.3 存在的挑战 115
5.5.4 现有方法 116
5.6 推理机器阅读理解 116
5.6.1 任务定义 116
5.6.2 代表数据集 117
5.6.3 存在的挑战 118
5.6.4 现有方法 119
5.7 本章小结 119
第6章 开放性问题 120
6.1 开放性问题 120
6.1.1 相关文章的快速检索获取 120
6.1.2 机器阅读理解系统的鲁棒性 121
6.1.3 缺乏对外部知识的运用 121
6.1.4 缺乏推理的能力 122
6.1.5 缺乏可解释性 122
6.2 全书总结 122
附录一 机器学习基础概念 124
附录二 文本分析基础 132
附录三 传统机器阅读理解概述 139
附录四 简称一览表 147
附录五 可用代码资源 149
参考文献 150