我读的关于lucene的第一篇文章是:《Lucene:基于Java的全文检索引擎简介》
这是一篇非常不错的文章,能让我们很快对lucene有一个很好的了解。
用最通俗的话来讲,lucene就是提供全文搜索功能的类库,所以我们还需要根据实际情况自行完成搜索程序的其他模块。越发的留有余地,越发的就有发展的空间。如中国的红楼一样。
lucene能够让我们不需要了解非常复杂的索引和搜索实现的情况下,通过调用它的一些简单API实现复杂的搜索功能。
lucene环境搭建的过程如下:
1、下载lucene3.0.3
地址:http://apache.mirror.phpchina.com/lucene/java/
2、下载jdk1.6
3、下载tomcat
下载以上内容完成后,开始安装。
1、安装jdk
一路确定下去,无需选择。
2、安装tomcat
一路确定下去,无需选择。
3、解压文件即可
假设解压文件路径为d:\lucene\
现在可以建立目录(此处的目录为我们要进行检索的信息的原始数据文件,我们放置在docs中,还有一个是lucene生成的检索信息,我们放置于index中),即可以在d:\lucene下建立一个temp\docs以及temp\index,此处两个文件夹目录可以随意,当然不一定非得放置于d:\lucene。
然后将需要检索的原始数据文件放置于docs文件夹中。
拷贝解压的lucene文件夹中的lucene-core-2.3.2.jar以及lucene-demos-2.3.2.jar到temp文件夹中,解压。
如果没有配置jdk环境,参考下方:
打开我的电脑-属性-高级-环境变量:
在系统变量中添加:
JAVA_HOME C:\Program Files\Java\jdk1.6.0
PATH %JAVA_HOME%\bin
CLASSPATH .;%JAVA_HOME%\lib\tools.jar;%JAVA_HOME%\jre\lib\rt.jar;
打开命令行:将目录定位到temp文件夹。
输入命令:
java org.apache.lucene.demo.IndexHTML -create -index D:\lucene\temp\index D:\lucene\temp\docs
即建立索引与原始数据文件的关系。
完成后,会发现index文件夹中多处一部分数据,以后再研究。
然后找到tomcat的安装目录,拷贝lucene中的luceneweb.war进入tomcat的webapps\文件夹中,启动tomcat,会看见webapps\下多出一个文件夹,找到configuration.jsp文件,将其中的String indexLocation = "/opt/lucene/index";修改为String indexLocation = "D:/lucene/temp/index";就是刚才生成的文件。
打开浏览器,输入http://localhost:8080/luceneweb/
输入需要查询的信息,看看结果如何。
简单地说:首先建立索引文件放置目录,cmd命令生成索引文件,部署工程,修改工程文件中目标为索引文件目录。
以上内容转自:
自此之后就可以编写lucene的程序体验一下lucene带来的全新感受了。