目录
前言
第1章 绪论 1
1.1 国内外研究概述 1
1.2 本书的主要工作 5
1.2.1 研究思路 5
1.2.2 主要工作 6
1.3 本书的组织结构 7
第2章 信息检索模型 9
2.1 信息检索 9
2.1.1 信息检索的定义 9
2.1.2 信息检索模型 10
2.2 经典信息检索模型 11
2.2.1 布尔模型 11
2.2.2 向量空间模型 11
2.2.3 概率模型 13
2.2.4 经典模型的简单比较 14
2.3 经典信息检索模型的改进 15
2.3.1 扩展布尔模型 15
2.3.2 广义向量空间模型 16
2.4 结构化文档检索模型 17
2.4.1 结构化文档检索的概念 17
2.4.2 结构化文档检索模型 18
2.5 语义检索 20
2.6 本章小结 22
第3章 检索评价与测试参考集 23
3.1 检索评价 23
3.1.1 查全率与查准率 24
3.1.2 其他测度方法 27
3.2 测试参考文献集 30
3.2.1 TREC测试参考 30
3.2.2 CACM与ISI测试集 32
3.2.3 中文Web测试集CWT 33
3.3 一个小型中文信息检索测试集的构建与分析 35
3.3.1 文档集的构建 35
3.3.2 查询集的构建 37
3.3.3 相关判断集的构建 37
3.3.4 测试集的分析 39
3.4 本章小结 41
第4章 基于贝叶斯网络的信息检索模型 42
4.1 贝叶斯概率与贝叶斯网络 42
4.1.1 贝叶斯概率 42
4.1.2 贝叶斯网络理论 43
4.2 基于贝叶斯网络的信息检索模型 46
4.2.1 推理网络模型 46
4.2.2 信念网络模型 48
4.2.3 贝叶斯网络检索模型 51
4.2.4 减少术语之间关系提高BNR模型的效率 53
4.2.5 基于贝叶斯网络的结构化文档检索模型 56
4.3 本章小结 60
第5章 词语之间关系及其量化方法 61
5.1 词语相关性及其计算 61
5.1.1 基于共现的词语相关度 61
5.1.2 基于本体的术语关系及其量化方法 64
5.2 词语相似性及其度量 67
5.2.1 信息检索用同义词的定义 67
5.2.2 同义词词典 67
5.2.3 词语相似度 69
5.3 一种基于共现分析法改进的PF-IBF方法 74
5.3.1 PF-IBF方法 74
5.3.2 利用共现分析法对PF-IBF方法的改进 75
5.3.3 实验及评测 77
5.4 本章小结 78
第6章 基于术语关系的信念网络模型扩展 80
6.1 基于查询术语同义关系的信念网络模型扩展 80
6.1.1 基本概念 80
6.1.2 模型拓扑结构 81
6.1.3 文档检索 81
6.2 基于索引术语共现关系的信念网络模型扩展 83
6.2.1 索引术语之间共现关系的挖掘 83
6.2.2 模型拓扑结构 84
6.2.3 文档检索 85
6.3 其他基于索引术语关系的信念网络模型扩展 87
6.3.1 基于索引术语同义关系的信念网络模型扩展 87
6.3.2 融合术语同义和相关关系扩展信念网络模型 88
6.4 实验与分析 89
6.4.1 实验数据 89
6.4.2 基于查询术语同义关系的扩展模型性能 90
6.4.3 基于索引术语共现关系的扩展模型性能 91
6.5 本章小结 92
第7章 组合不同证据的扩展信念网络模型 93
7.1 相关研究 93
7.1.1 叙词表 93
7.1.2 组合过去查询证据的扩展信念网络模型 94
7.2 组合同义词证据的扩展信念网络模型 97
7.2.1 模型拓扑结构 97
7.2.2 证据的获得 98
7.2.3 文档检索 98
7.2.4 实验与分析 101
7.3 组合科技文献间引用关系的信念网络模型扩展 102
7.3.1 科技文献之间引用关系的分析及其量化 103
7.3.2 组合文档关注度和价值度证据的信念网络检索模型 106
7.3.3 实验与分析 109
7.4 本章小结 111
第8章 基于术语相似关系的简单贝叶斯网络模型扩展 112
8.1 基本SBN模型 112
8.1.1 拓扑结构 112
8.1.2 概率分布 113
8.1.3 推理与检索 114
8.2 基于术语间同义关系扩展的SBN模型 115
8.2.1 SSBN模型的拓扑结构 116
8.2.2 挖掘术语间关系 116
8.2.3 SSBN模型的概率估计 117
8.2.4 推理与检索 118
8.2.5 利用术语相似度改进扩展的贝叶斯网络检索模型 118
8.2.6 模型性能评估 119
8.3 基于文档间关系扩展的 SBN模型 122
8.3.1 DSBN模型的拓扑结构 123
8.3.2 DSBN模型的概率估计 123
8.3.3 推理与检索 124
8.4 本章小结 126
第9章 利用术语关系扩展基于贝叶斯网络的结构化文档检索模型 127
9.1 相关知识 127
9.1.1 结构化文档与结构化文档检索 127
9.1.2 影响图 128
9.1.3 XML文档 129
9.2 一个基于贝叶斯网络的XML文档查询模型 130
9.2.1 XML文档处理 131
9.2.2 XML文档查询过程 132
9.2.3 基于贝叶斯网络的XML文档查询模型 133
9.3 基于术语共现关系扩展的SID模型 136
9.3.1 扩展SID模型的拓扑结构 136
9.3.2 术语间关系的学习 138
9.3.3 扩展模型的概率估计 138
9.3.4 推理与检索 141
9.4 基于术语关系扩展的BN-SD模型简介 142
9.5 本章小结 144
第10章 词语关系在信息检索其他方面的应用 145
10.1 利用词语之间关系改进文本特征提取方法 145
10.1.1 文本特征提取的概念和常见方法 145
10.1.2 利用词语关系对TF-IDF方法改进 149
10.2 基于同义词关系改进的局部共现查询扩展 152
10.2.1 基于局部共现和同义词关系的查询扩展方法 153
10.2.2 利用同义词改进的局部共现查询扩展方法 153
10.2.3 实验与比较 156
10.3 基于术语同义关系的文档相似度计算 157
10.3.1 常用的文档相似度计算方法及其不足 157
10.3.2 基于术语同义关系的文档相似度计算 159
10.3.3 实验及评价 160
10.4 本章小结 162
第11章 基于信念网络的话题识别与追踪模型 163
11.1 话题识别与追踪的基础知识 163
11.1.1 基本概念与主要任务 163
11.1.2 实现方法 165
11.2 基于信念网络的静态话题模型 167
11.2.1 静态话题模型理论 167
11.2.2 基于信念网络的静态话题模型Ⅰ 168
11.2.3 基于信念网络的静态话题模型Ⅱ 170
11.3 基于信念网络的动态话题模型 172
11.3.1 动态话题模型理论 172
11.3.2 基于信念网络的动态话题模型Ⅰ 174
11.3.3 基于信念网络的动态话题模型Ⅱ 175
11.4 本章小结 177
总结与展望 178
参考文献 180