第1章 XML查询处理技术 1.1 XML文档标准 1.1.1 XML简介 1.1.2 DTD 1.1.3 XSD 1.2 XML文档模型 1.2.1 对象交换模型(OEM) 1.2.2 文档对象模型(DOM) 1.3 完全结构下的XML查询技术 1.3.1 FS查询模型 1.3.2 XPath 1.3.3 XQuery 1.3.4 FS模型比较 1.4 基于编码的XMI。查询技术 1.4.1 XML编码技术 1.4.2 基于编码的结构连接方法 1.5 基于结构索引的XML查询技术第2章 非完全结构下的XMI.查询概述 2.1 背景与动机 2.2 NFS查询关键技术 2.3 XML检索查询模型 2.3.1 基于关键字的查询模型 2.3.2 基于标签和关键字的查询模型 2.4 FS查询扩展 2.5 NFS查询模型第3章 有意义的NFS查询结果 3.1 一致文档片段 3.2 Interconnection关系 3.3 有意义的最近公共祖先 3.4 最小全部目标对象网(MTTON) 3.5 PE模型 3.5.1 讨论 3.5.2 相关概念 3.5.3 PE模式和实体 3.5.4 PE规则 3.5.5 等价模式和等价查询项 3.5.6 比较分析 3.6 GPE模型 3.6.1 概念与定义 3.6.2 GPE模式与实体 3.6.3 GPE规则 3.6.4 GPE等价模式 3.6.5 性能分析第4章 NFS查询处理关键技术 4.1 Interconnection关系计算 4.2 MLCAS计算 4.2.1 Timber 4.2.2 基于图的MLCA求解方法 4.3 PE模型计算 4.3.1 XML编码 4.3.2 PE索引 4.3.3 12P倒排索引 4.3.4 判别方法 4.3.5 算法设计 4.3.6 比较分析 4.4 L(k)-index 4.4.1 基于k双拟的结构索引 4.4.2 基本概念与定义 4.4.3 L(k)-index索引结构 4.4.4 查询处理 4.4.5 L(k)-index创建与更新 4.4.6 性能分析第5章 NFS查询结果聚类 5.1 引言 5.2 文档特征降维技术 5.2.1 特征选取技术 5.2.2 基于概念的降维技术 5.3 基于传统聚类技术的文档聚类方法 5.3.1 基于相似性的聚类方法 5.3.2 基于模型的聚类方法 5.3.3 基于划分的聚类方法 5.3.4 基于层次的聚类方法 5.4 面向文档特性的聚类方法 5.4.1 潜在语义分析 5.4.2 基于信息论的文档聚类方法 5.4.3 双向聚类方法 5.5 聚类质量评价方法第6章 基于模型的非偏斜文档聚类方法 6.1 引言 6.2 相关工作 6.2.1 基于多项式分布的硬聚类 6.2.2 基于平衡约束的聚类方法 6.3 聚类偏斜的分析 6.3.1 相关概念与定义 6.3.2 聚类偏斜产生的原因 6.4 MMPClust聚类方法 6.4.1 基于内容特性的簇模型 6.4.2 估计样本选取 6.4.3 MMPClust算法 6.5 实验分析 6.5.1 数据集 6.5.2 实验方法与评价方法 6.5.3 实验结果与分析 6.6 小结第7章 基于信息论的潜在概念获取与文档聚类方法 7.1 相关工作 7.2 模型提出 7.2.1 词、潜在概念、文档和主题的关系 7.2.2 模型描述 7.3 模型求解 7.3.1 给定β下目标函数求解 7.3.2 潜在概念个数确定 7.3.3 算法设计 7.4 实验分析 7.4.1 数据集和实验方法 7.4.2 性能分析 7.5 小结参考文献