第1章 绪论
1.1 研究背景
1.2 研究意义
1.3 研究目标
1.4 研究内容
1.5 本书组织结构
第2章 文本语义相似度研究现状
2.1 标注数据及评估方法
2.1.1 早期评估数据
2.1.2 SemEval STS任务数据
2.1.3 系统评估方法
2.2 文本语义相似度研究方法
2.2.1 无监督模型
2.2.2 有监督模型
2.3 认知概念信息量方法
第3章 基于认知概念信息量的文本语义相似度基本模型
3.1 引言
3.2 相关工作
3.3 认知概念空间中的文本语义相似度
3.3.1 认知概念空间与认知概念信息量
3.3.2 基于容斥原理的文本认知概念信息量
3.3.3 文本语义相似度基本模型
3.4 模型的实现
3.4.1 知识库与数据库的使用
3.4.2 获取认知概念的频率
3.4.3 选择词语对应的认知概念
3.5 实验
3.5.1 模型的整体性能
3.5.2 知识库和数据库的影响分析
3.5.3 模型的适应性分析
3.5.4 模型准确率和效率的关系分析
3.6 本章小结
第4章 基于认知概念信息增益的文本信息量计算方法
4.1 引言
4.2 预备知识
4.3 文本信息量的计算与证明
4.3.1 基本概念和函数
4.3.2 文本信息量计算公式的推导
4.3.3 文本信息量的高效算法
4.4 算法复杂性分析与实验
4.4.1 算法复杂性分析
4.4.2 算法效率对比实验
4.5 本章小结
第5章 融合认知概念信息权重的全文本信息量计算方法
5.1 引言
5.2 相关工作
5.3 融合认知概念信息权重的全文本信息量
5.3.1 基于WordNet的名词化方法
5.3.2 未登录词和功能词的计算
5.3.3 加权的文本信息量
5.4 实验
5.4.1 实验设置
5.4.2 增强模型的整体性能
5.4.3 与句嵌入表示方法的比较
5.4.4 增强模型对其他方法性能的提升
5.4.5 增强模型的各核心模块分析
5.4.6 名词化方法分析
5.4.7 基于WordNet的派生方法分析
5.4.8 未登录命名实体计算分析
5.4.9 信息权重融合分析
5.5 本章小结
第6章 基于增强模型的测评系统
6.1 SemEval STS测评任务简介
6.2 SemEval STS测评系统
6.2.1 增强模型测评系统(Run 1)
6.2.2 融合词语对齐模型的系统(Run 2)
6.2.3 融合深度学习模型的系统(Run 3)
6.3 测评数据集
6.4 系统评估
6.4.1 数据预处理
6.4.2 成绩及讨论
6.5 STS Benchmark
6.6 本章小结
总结和展望
参考文献