您现在的位置:首页 > 知识库 > 计算机与软件 >Java搜索引擎指南 Lucene in Action(中文版)
Java搜索引擎指南 Lucene in Action(中文版)

Java搜索引擎指南 Lucene in Action(中文版)

资料大小: 41.91 MB
文档格式: PDF文档
资料语言: 简体中文
资料类别: 计算机与软件
更新日期: 2020-04-23
下载说明:
推荐信息: 中文版   Lucene   in   Action   高斯帕

本地下载(30点)  备用下载(30点)

内容简介
Lucene in Action(中文版)
出版时间:2007
丛编项: Java搜索引擎指南
内容简介
  本书深入浅出地介绍了Lucene——一个开源的使用Java语言编写的全文搜索引擎开发包。它通过浅显的语言、大量的图注、丰富的代码示例,以及清晰的结构为读者呈现出作为优秀开源项目的Lucene所体现的强大功能,且Lucene是从网上可以得到的最好的开源Java搜索引擎。全书共10章,分为两大部分。第1部分Lucene的核心,着重于Lucene的核心API介绍,并按照把Lucene集成到程序中的顺序来组织;第2部分Lucene的应用,通过对Lucene内置工具的介绍,展示了Lucene技术的高级应用和在各种程序语言的移植。本书既可作为学习材料,又可以作为参考手册。本书适合于已经熟悉基本Java编程的读者,以及希望能够把强大的搜索功能加入到自己的应用程序中的开发者。对于从事搜索引擎工作的工程技术人员,以及在Java平台下进行各类软件开发的人员和编程爱好者,本书也有很好的学习参考价值。
目录
推荐序.
译者序
前言1
前言2
致谢
关于此书
第1部分 Lucene的核心
第1章 初识Lucene
1.1 信息组织和访问的发展历程
1.2 理解Lucene
1.3 索引和搜索
1.4 Lucene实践:一个应用实例
1.5 理解索引过程的核心类
1.6 理解搜索过程的核心类
1.7 可选择的同类产品
1.8 小结
第2章 索引
2.1 理解索引过程
2.2 基本索引操作
2.3 增强Document和Field对象
2.4 索引日期
2.5 索引数字
2.6 索引Field对象用于排序
2.7 控制索引过程
2.8 优化索引
2.9 并发性. 线程安全性以及锁机制
2.10 调试索引过程
2.11 小结
第3章 为应用程序添加搜索功能
3.1 实现一个简单的搜索程序
3.2 使用IndexSearcher
3.3 理解Lucene的评分机制
3.4 在程序代码中创建Query对象
3.5 解析查询表达式:QueryParser
3.6 小结
第4章 分析
4.1 使用分析器
4.2 剖析分析器
4.3 使用内置的分析器
4.4 处理关键词域
4.5 近音词查询
4.6 同义词. 别名以及其他表示相同意义的词
4.7 词干分析
4.8 语言分析
4.9 Nutch分析
4.10 小结
第5章 高级搜索技术
5.1 对搜索结果进行排序
5.2 使用PhrasePrefixQuery
5.3 一次实现在多个域上的查询
5.4 跨度查询:Lucene新的隐藏法宝
5.5 搜索过滤
5.6 对多个索引的搜索..
5.7 使用项向量
5.8 小结
第6章 扩展搜索
6.1 使用自定义的排序方法
6.2 编写自定义的HitCollector
6.3 扩展QueryParser
6.4 使用自定义过滤器
6.5 性能测试
6.6 小结
第2部分 Lucene的应用
第7章 对常用格式的文档进行解析
7.1 对富文本文档进行处理
7.2 索引XML文档
7.3 索引PDF文档
7.4 索引HTML文档
7.5 索引Microsoft Word文档
7.6 索引RTF文档
7.7 索引纯文本文档
7.8 创建文档处理框架
7.9 其他文本提取工具
7.10 小结
第8章 Lucene的相关工具及其扩展
8.1 Lucene的Sandbox工具包的使用
8.2 与索引的交互
8.3 Analyzers.ctokenizers和TokenFilters
8.4 使用Ant和Lucene进行Java开发
8.5 JavaScirpt浏览器工具
8.6 WordNet中的同义词
8.7 高亮显示查询项
8.8 链式过滤器
8.9 在Berkeley DB中存储索引
第9章 Lucene的移植
9.1 移植版本与Lucene的关系
9.2 CLucene
9.3 dotLucene
9.4 Plucene
9.5 Lupy
9.6 PyLucene
9.7 小结
第10章 案例分析
10.1 Nutch:“搜索引擎的NPR”
10.2 在jGuru上使用Lucene
10.3 在SearchBlox中使用Lucene
10.4 Xtra Mind公司使用Lucene开发的XM-InformationMinderTM
10.5 Alias-i:Lucene中的拼写变体
10.6 Michaels.com上设计精巧的搜索功能
10.7 我喜欢Lucene:TheServerSide
10.8 结论
附录A 安装Lucene
附录B Lucene索引文件格式
附录C 资源...