目录
《博士后文库》序言
前言
第1章 绪论 1
1.1 信息检索技术及其发展 1
1.2 面向搜索引擎的智能信息检索技术 2
1.3 查询意图理解和相关性排序 3
1.4 排序学习 4
1.4.1 点级排序学习模型 5
1.4.2 对级排序学习模型 6
1.4.3 列表级排序学习模型 7
1.5 智能信息检索评价指标 8
1.6 智能信息检索相关应用场景 10
1.7 本书研究内容及章节安排 12
参考文献 14
第2章 基于混合模型的查询意图理解 19
2.1 引言 19
2.2 相关研究工作 20
2.3 查询意图分类模型整体框架 21
2.4 查询向量表示 22
2.5 基于混合模型的查询意图分类 23
2.5.1 面向中间类别的意图匹配 23
2.5.2 面向最终分类的查询意图分类 27
2.6 查询意图分类方法性能评估 28
2.6.1 实验设置 28
2.6.2 对比模型和评价指标 28
2.6.3 实验结果与分析 29
2.7 本章小结 30
参考文献 31
第3章 面向生物医学文本检索的监督式查询扩展 34
3.1 引言 34
3.2 相关研究工作 35
3.3 监督式生物医学扩展词排序方法 36
3.3.1 方法整体流程 36
3.3.2 候选扩展词抽取 37
3.3.3 词项标注策略 37
3.3.4 词特征抽取 38
3.3.5 排序模型构建 41
3.4 监督式查询扩展方法性能评估 43
3.4.1 实验设置 43
3.4.2 标注策略性能评估 44
3.4.3 扩展词特征性能评估 44
3.4.4 损失函数性能评估 45
3.4.5 整体检索性能 45
3.4.6 实验结果与分析 47
3.5 本章小结 48
参考文献 48
第4章 排序学习文档特征生成 51
4.1 引言 51
4.2 相关研究工作 52
4.3 基于查询级半监督自编码器的排序模型 54
4.3.1 降噪自编码器 54
4.3.2 基于Bregman散度的损失函数 55
4.3.3 查询约束 56
4.4 半监督自编码排序方法性能评估 58
4.4.1 实验设置 58
4.4.2 多种自编码器强化的排序性能对比 59
4.4.3 多种排序学习方法的性能对比 61
4.4.4 与深度排序模型的检索性能对比 62
4.4.5 特征维度对实验性能的影响 64
4.4.6 讨论 64
4.5 本章小结 65
参考文献 65
第5章 直接优化信息检索评价指标的排序学习算法 70
5.1 引言 70
5.2 相关研究工作 72
5.3 信息检索评价指标 73
5.3.1 平均排序倒数 73
5.3.2 期望倒数排序 73
5.3.3 Q-measure评价指标 74
5.4 基于AdaRank的排序特征生成方法 75
5.4.1 特征生成框架 75
5.4.2 基于AdaRank直接优化信息检索评价指标 77
5.4.3 基于标准数据集的特征生成框架 79
5.5 直接优化评价指标排序方法性能评估 79
5.5.1 语料库 79
5.5.2 实验设置 80
5.5.3 所提出三种排序算法的性能评估 80
5.5.4 对生成特征集的评价 83
5.5.5 对组合特征集的评价 86
5.5.6 实验分析与讨论 86
5.6 本章小结 87
参考文献 88
第6章 融合多重损失函数的排序学习模型 91
6.1 引言 91
6.2 相关研究工作 92
6.3 问题定义 92
6.4 融合多重损失函数的排序学习 94
6.4.1 多种候选损失函数 94
6.4.2 基于梯度下降的损失优化 95
6.4.3 基于加权损失函数的重要性进行排序 96
6.5 多重损失函数融合排序方法性能评估 98
6.5.1 数据集和实验设置 98
6.5.2 对级损失函数选择 98
6.5.3 列表级损失函数选择 99
6.5.4 正则加权策略的效果评估 99
6.5.5 迭代敏感加权策略的效果评估 100
6.5.6 接力加权策略的效果评估 100
6.5.7 整体性能比较 101
6.5.8 与其他算法的比较 103
6.6 本章小结 103
参考文献 104
第7章 基于排序学习的情感原因抽取 107
7.1 引言 107
7.2 相关研究工作 108
7.3 面向情感原因抽取的排序模型 110
7.3.1 问题定义 110
7.3.2 面向情感原因的子句排序特征 111
7.3.3 面向情感原因的排序模型构建 113
7.4 基于排序的情感原因抽取方法性能评估 115
7.4.1 实验设置 115
7.4.2 与现有方法的比较 116
7.4.3 排序特征的比较 118
7.4.4 特征词的性能比较 119
7.4.5 主题模型的特征比较 120
7.4.6 停用词和情感级别归一化的影响 120
7.4.7 讨论 121
7.5 本章小结 121
参考文献 121
第8章 基于预训练词嵌入的词排序模型 125
8.1 引言 125
8.2 相关研究工作 126
8.3 融合词嵌入向量的词排序模型 127
8.3.1 方法基本框架 127
8.3.2 候选扩展词的获取 128
8.3.3 基于单词表示的词特征抽取 128
8.3.4 词标注策略 130
8.3.5 基于排序学习的扩展词排序模型 131
8.4 词排序模型性能评估 132
8.4.1 实验设置 132
8.4.2 点级、对级和列表级方法的性能评估 135
8.4.3 与基线模型的结果比较 139
8.4.4 跨数据集训练词排序模型的有效性 141
8.4.5 参数选择过程 141
8.4.6 词排序模型的分析与讨论 143
8.5 本章小结 144
参考文献 144
第9章 基于社会化标注和主题模型的个性化检索 148
9.1 引言 148
9.2 相关研究工作 149
9.3 基于社会化标注的个性化文档检索 151
9.3.1 文档重构 151
9.3.2 主题模型优化 152
9.3.3 个性化文档检索 154
9.4 个性化检索方法性能评估 155
9.4.1 实验设置 155
9.4.2 实验结果与分析 156
9.5 本章小结 159
参考文献 159
第10章 融合语义词向量的社交媒体文本检索 162
10.1 引言 162
10.2 相关研究工作 163
10.3 基于词向量的微博查询扩展 166
10.4 微博检索方法性能评估 167
10.4.1 实验设置 167
10.4.2 微博检索伪相关反馈的参数选择 168
10.4.3 实验对比模型 169
10.4.4 基于词向量的伪相关反馈查询扩展性能 170
10.5 本章小结 172
参考文献 172
第11章 面向社交媒体的用户画像技术 175
11.1 引言 175
11.2 相关研究工作 176
11.3 基于两阶段多通路模型融合框架的用户画像构建方法 178
11.4 融合特征萃取的多粒度卷积神经网络用户画像构建方法 179
11.4.1 多粒度用户特征抽取 180
11.4.2 特征融合层 181
11.4.3 综合输出层 183
11.5 基于社交卷积注意力网络的用户画像构建方法 184
11.5.1 基于文本注意力的用户属性分类 185
11.5.2 基于文本和社交网络注意力的用户属性分类 186
11.6 用户画像方法性能评估 187
11.6.1 实验设置 187
11.6.2 对比模型 189
11.6.3 注意力层的效用 191
11.6.4 文本注意力和社交网络注意力的效用 191
11.6.5 注意力可视化 192
11.7 本章小结 193
参考文献 193
第12章 面向多样化排序的医疗文本匹配 198
12.1 引言 198
12.2 医疗文本匹配技术及其研究进展 199
12.2.1 医疗问答技术 199
12.2.2 面向多样性的信息检索 200
12.2.3 面向医疗文本的排序学习方法 200
12.3 面向多样性排序的医疗文本匹配方法 201
12.3.1 方法整体框架 201
12.3.2 医疗答案的标注策略 201
12.3.3 排序特征抽取 204
12.3.4 医疗答案排序学习方法 206
12.4 医疗文本匹配方法性能评估 209
12.4.1 实验设置 209
12.4.2 评价指标 209
12.4.3 医疗问题和答案的标注 210
12.4.4 对比的排序模型 211
12.4.5 检索性能评估结果 212
12.4.6 不同排序学习方法的性能评估 213
12.4.7 讨论 217
12.5 本章小结 217
参考文献 218
第13章 基于胶囊网络的医疗问答研究 221
13.1 引言 221
13.2 基于胶囊网络的医疗问答模型 222
13.2.1 输入表示 223
13.2.2 交互信息提取 224
13.2.3 双向胶囊网络层 224
13.3 医疗问答方法性能评估 226
13.3.1 实验设置 226
13.3.2 问答模型性能评估 227
13.3.3 所提出模型中不同层的影响 228
13.3.4 随机过采样的影响 228
13.3.5 动态路由算法中迭代次数的作用 229
13.4 本章小结 230
参考文献 230
第14章 总结与展望 233
14.1 总结 233
14.2 展望 235
编后记 237
彩图