Lucene在Linux下环境的搭建和运行
Lucene 在 Linux 下环境的搭建和运行
1. 介绍
_ Lucene _
是一个用 Java 写的全文索引引擎工具包,软件包中包括一些简单的例程,可以直接试用。本例将测试对一个目录中的 txt 文件进行索引,并通过索引找到相应的文件。
2. 原理
反向搜索机制,维护了一个词/短语表,对于这个表中的每个词/短语,都有一个链表描述了有哪些文档包含了这个词/短语。
Lucene 软件包的发布形式是一个 JAR 文件,包说明
org.apache.lucene.analysis 用于分词
org.apache.lucene.index 用于建立索引
org.apache.lucene.search 用于搜索
3. 安装
- 下载: [http://xiexiejiao.cn/java/lucene-3-0-2-release-download.html
](http://xiexiejiao.cn/java/lucene-3-0-2-release-download.html)
本文以 lucene-3.0.3-src.tar.gz 为例,在 Linux 中安装运行
- 安装相关工具
安装 JDK 1.5 以上版本
安装 Ant 工具(Ant 是编译 Java 的工具,与 make 功能相似) $ apt-get install ant
安装(参见源码包中 BUILD.txt 说明) $ tar xvzf lucene-3.0.3-src.tar.gz
$ cd lucene
$ ant // 此时在build目录下产生jar包
$ ant compile-demo
$ ant jar-demo // 此时在 build 目录下产生 demo 的 jar 包运行
$ export CLASSPATH=$CLASSPATH:xxx/build/lucene-
core-3.0.3-dev.jar:xxx/build/lucene-demos-3.0.3-dev.jar // 设置 jar
包环境变量
$ java org.apache.lecene.demo.IndexFiles TXT所在的目录名 //
此时生成了索引
$ java org.apache.lecene.demo.SearchFiles
//然后按提示输入要查的词,即可找到相应的 txt
4. 参考
- Lucene 入门
http://www.iteye.com/topic/33241
(转载请注明出处)