注册 | 登录读书好,好读书,读好书!
读书网-DuShu.com
当前位置: 首页出版图书科学技术计算机/网络软件与程序设计其他编程语言/工具Lucene in Action 中文版

Lucene in Action 中文版

Lucene in Action 中文版

定 价:¥49.00

作 者: (美)高斯帕那(Gospodnetic,O.),(美)哈特赫(Hatcher,E.) 著,谭鸿 等译
出版社: 电子工业出版社
丛编项: Java搜索引擎指南
标 签: 计算机

ISBN: 9787121032172 出版时间: 2007-01-01 包装: 胶版纸
开本: 16 页数: 393 字数:  

内容简介

  本书深入浅出地介绍了Lucene——一个开源的使用Java语言编写的全文搜索引擎开发包。它通过浅显的语言、大量的图注、丰富的代码示例,以及清晰的结构为读者呈现出作为优秀开源项目的Lucene所体现的强大功能,且Lucene是从网上可以得到的最好的开源Java搜索引擎。全书共10章,分为两大部分。第1部分Lucene的核心,着重于Lucene的核心API介绍,并按照把Lucene集成到程序中的顺序来组织;第2部分Lucene的应用,通过对Lucene内置工具的介绍,展示了Lucene技术的高级应用和在各种程序语言的移植。本书既可作为学习材料,又可以作为参考手册。本书适合于已经熟悉基本Java编程的读者,以及希望能够把强大的搜索功能加入到自己的应用程序中的开发者。对于从事搜索引擎工作的工程技术人员,以及在Java平台下进行各类软件开发的人员和编程爱好者,本书也有很好的学习参考价值。

作者简介

  Erik Hatcher为Ant、Lucene以及Tapestry这些开源项目作出了巨大的贡献,此外,他还是“Java Development with Ant”一书的作者之一,该书获得了JDJ读者选择奖First Runner Up大奖。Otis Gospodnetic是Lucene的核心开发成员,Apache Jakarta Project Management Committee的成员,jGuru的Lucene FAQ维护者。本书的两位作者都曾发表过大量的技术文章,当然其中有一些是关于Lucene的。...

图书目录

推荐序.  
译者序  
前言1  
前言2  
致谢  
关于此书  
第1部分 Lucene的核心  
第1章 初识Lucene  
1.1 信息组织和访问的发展历程  
1.2 理解Lucene  
1.3 索引和搜索  
1.4 Lucene实践:一个应用实例  
1.5 理解索引过程的核心类  
1.6 理解搜索过程的核心类  
1.7 可选择的同类产品  
1.8 小结  
第2章 索引  
2.1 理解索引过程  
2.2 基本索引操作  
2.3 增强Document和Field对象  
2.4 索引日期  
2.5 索引数字  
2.6 索引Field对象用于排序  
2.7 控制索引过程  
2.8 优化索引  
2.9 并发性. 线程安全性以及锁机制  
2.10 调试索引过程  
2.11 小结  
第3章 为应用程序添加搜索功能  
3.1 实现一个简单的搜索程序  
3.2 使用IndexSearcher  
3.3 理解Lucene的评分机制  
3.4 在程序代码中创建Query对象  
3.5 解析查询表达式:QueryParser  
3.6 小结  
第4章 分析  
4.1 使用分析器  
4.2 剖析分析器  
4.3 使用内置的分析器  
4.4 处理关键词域  
4.5 近音词查询  
4.6 同义词. 别名以及其他表示相同意义的词  
4.7 词干分析  
4.8 语言分析  
4.9 Nutch分析  
4.10 小结  
第5章 高级搜索技术  
5.1 对搜索结果进行排序  
5.2 使用PhrasePrefixQuery  
5.3 一次实现在多个域上的查询  
5.4 跨度查询:Lucene新的隐藏法宝  
5.5 搜索过滤  
5.6 对多个索引的搜索..  
5.7 使用项向量  
5.8 小结  
第6章 扩展搜索  
6.1 使用自定义的排序方法  
6.2 编写自定义的HitCollector  
6.3 扩展QueryParser  
6.4 使用自定义过滤器  
6.5 性能测试  
6.6 小结  
第2部分 Lucene的应用  
第7章 对常用格式的文档进行解析  
7.1 对富文本文档进行处理  
7.2 索引XML文档  
7.3 索引PDF文档  
7.4 索引HTML文档  
7.5 索引Microsoft Word文档  
7.6 索引RTF文档  
7.7 索引纯文本文档  
7.8 创建文档处理框架  
7.9 其他文本提取工具  
7.10 小结  
第8章 Lucene的相关工具及其扩展  
8.1 Lucene的Sandbox工具包的使用  
8.2 与索引的交互  
8.3 Analyzers.ctokenizers和TokenFilters  
8.4 使用Ant和Lucene进行Java开发  
8.5 JavaScirpt浏览器工具  
8.6 WordNet中的同义词  
8.7 高亮显示查询项  
8.8 链式过滤器  
8.9 在Berkeley DB中存储索引  
第9章 Lucene的移植  
9.1 移植版本与Lucene的关系  
9.2 CLucene  
9.3 dotLucene  
9.4 Plucene  
9.5 Lupy  
9.6 PyLucene  
9.7 小结  
第10章 案例分析  
10.1 Nutch:“搜索引擎的NPR”  
10.2 在jGuru上使用Lucene  
10.3 在SearchBlox中使用Lucene  
10.4 Xtra Mind公司使用Lucene开发的XM-InformationMinderTM  
10.5 Alias-i:Lucene中的拼写变体  
10.6 Michaels.com上设计精巧的搜索功能  
10.7 我喜欢Lucene:TheServerSide  
10.8 结论  
附录A 安装Lucene  
附录B Lucene索引文件格式  
附录C 资源...  


本目录推荐