目录
第一章 概述
1.1文档数据库
1.2文档压缩
1.3索引
1.4文档图像
1.5海量文档管理系统
1.6进一步阅读
第二章 文本压缩
2.1模型
2.2自适应模型
2.3编码
2.4符号模型
2.5字典模型
2.6同步
2.7性能比较
2.8进一步阅读
第三章 索引
3.1样本文档集合
3.2倒置文件索引
3.3倒置文件压缩
3.4索引压缩方法性能
3.5署名文件和位图
3.6字体转换及词根化和无用词
3.7索引方法比较
3.8进一步阅读
第四章 查询
4.1词典访问
4.2部分指定查询术语
4.3布尔查询处理
4.4排列及信息检索
4.5检索有效性估算
4.6余弦法的实现
4.7交互式检索
4.8进一步阅读
第五章 索引构造
5.1基于内存的倒置
5.2基于排序分类的倒置
5.3使用索引压缩
5.4压缩内存中倒置
5.5索引方法的对比
5.6构造署名文件和位图
5.7动态集合
5.8进一步阅读
第六章 图像压缩
6.1图像类型
6.2二值图像的CCITT传真标准
6.3基于上下文的二值图像压缩
6.4JBIG:二值图像的标准
6.5JPEG:连续色调图像的标准
6.6灰度图像的无损压缩
6.7图像的递增传输
6.8图像压缩技术小结
6.9进一步阅读
第七章 文本图像
7.1文本图像压缩的概念
7.2有损及无损压缩
7.3标志提取
7.4模板匹配
7.5从标志到符号
7.6对文本图像的成分进行编码
7.7性能:有损及无损模式
7.8对系统的考虑
7.9进一步阅读
第八章 混合图文
8.1确定方向
8.2分割
8.3分类
8.4进一步阅读
第九章 实现
9.1文本压缩
9.2文本压缩性能
9.3图像和文本图像
9.4索引构造
9.5索引压缩
9.6查询处理
9.7进一步阅读
第十章 信息爆炸
10.1信息技术发展两千年
10.2Internet:一种全球信息资源
10.3纸张问题
10.4面对信息爆炸
10.5使海量数据管理更好
10.6对生活的个人信息支持
10.7进一步阅读
附录A mg系统指南
A.1mg系统安装
A.2存储和检索的例子
A.3数据库生成
A.4查询一个索引后的文件集
A.5非文本文件
A.6图像压缩程序
词汇表