Lucene 在 Linux 下环境的搭建和运行

1. 介绍
_ Lucene _

是一个用 Java 写的全文索引引擎工具包,软件包中包括一些简单的例程,可以直接试用。本例将测试对一个目录中的 txt 文件进行索引,并通过索引找到相应的文件。

2. 原理
反向搜索机制,维护了一个词/短语表,对于这个表中的每个词/短语,都有一个链表描述了有哪些文档包含了这个词/短语。 Lucene 软件包的发布形式是一个 JAR 文件,包说明
org.apache.lucene.analysis 用于分词
org.apache.lucene.index 用于建立索引
org.apache.lucene.search 用于搜索

3. 安装

  1. 下载: [http://xiexiejiao.cn/java/lucene-3-0-2-release-download.html

](http://xiexiejiao.cn/java/lucene-3-0-2-release-download.html)
本文以 lucene-3.0.3-src.tar.gz 为例,在 Linux 中安装运行

  1. 安装相关工具
  1. 安装 JDK 1.5 以上版本

  2. 安装 Ant 工具(Ant 是编译 Java 的工具,与 make 功能相似) $ apt-get install ant

  1. 安装(参见源码包中 BUILD.txt 说明) $ tar xvzf lucene-3.0.3-src.tar.gz
    $ cd lucene
    $ ant // 此时在build目录下产生jar包
    $ ant compile-demo
    $ ant jar-demo // 此时在 build 目录下产生 demo 的 jar 包

  2. 运行
    $ export CLASSPATH=$CLASSPATH:xxx/build/lucene-

core-3.0.3-dev.jar:xxx/build/lucene-demos-3.0.3-dev.jar // 设置 jar 包环境变量
$ java org.apache.lecene.demo.IndexFiles TXT所在的目录名 // 此时生成了索引
$ java org.apache.lecene.demo.SearchFiles //然后按提示输入要查的词,即可找到相应的 txt

4. 参考

  1. Lucene 入门
    http://www.iteye.com/topic/33241

(转载请注明出处)