Lucene 笔记一(是什么?,能做什么?,怎么做?)
Lucene 是什么?
??? ??? Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,
即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文
本分析引擎(英文与德文两种西方语言)。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便
的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。
?
创始人
??? ?? 原作者是Doug Cutting[d?u,'k?t??],他是一位资深全文索引/检索专家,曾经是V-Twin搜索引擎[6]的主要
开发者,后在Excite[7]担任高级系统架构设计师,目前从事于一些Internet底层架构的研究。早先发布在作者自
己的,后来发布在SourceForge[8],2001年年底成为apache软件基金会jakarta的一个子项目。
?
特点及优势
?????? Lucene是一个高性能、可伸缩的信息搜索(IR)库。它使你可以为你的应用程序添加索引和搜索能力。Lucene
是用java实现的成熟的、免费的开源项目。不仅使用它构建具体的全文检索应用,而且将之集成到各种系统软件中去,以及构建Web应用,甚至某些商业软件也采用了Lucene作为其内部全文检索子系统的核心。apache软件基金会的网站使用了Lucene作为全文检索的引擎,IBM的开源软件eclipse[9]的2.1版本中也采用了Lucene作为帮助子系统的全文索引引擎,相应的IBM的商业软件Web Sphere[10]中也采用了Lucene。Lucene以其开放源代码的特性、优异的索引结构、良好的系统架构获得了越来越多的应用。
?
**
lucene有7个包需要导入:analysis,document,index,queryParser,search,store,util
?
Lucene 能做什么?
?
??????? 大家都知道,Lucene是做搜索的,那它到底能做一些什么工作呢,它的角色又是什么。
??????? Lucene可以使你的应用软件具有索引和搜索的功能。Lucene可以对任何能够转换为文本格式的数据进行索引和搜索。Lucene并不关心数据的来源、格式甚至是语言,只要你能将这些数据转换为文本,这就意味着你可以使用Lucene来索引和搜索采用以下格式存储的数据:远程服务器上的网页、本地文件系统中的文档、简单的文本文件、Word文档、HTML、PDF以及一些其他的可以从中抽取出文本信息的格式。
?
Lucene角色:
????? Lucene是一个信息检索的函数库(Library),利用它你可以为你的应用加上索引和搜索的功能.
????? Lucene的使用者不需要深入了解有关全文检索的知识,仅仅学会使用库中的一个类,你就为你的应用实现全文检索的功能.
????? 不过千万别以为Lucene是一个象google那样的搜索引擎,Lucene甚至不是一个应用程序,它仅仅是一个工具,一个Library.你也可以把它理解为一个将索引,搜索功能封装的很好的一套简单易用的API.利用这套API你可以做很多有关搜索的事情,而且很方便.
?
?
Simple:
?建立索引
?
?
官网下载:http://lucene.apache.org/
?
?
?
?
1 楼 liuInsect 2012-02-07 可以做站内的搜索功能吗? 比如 淘宝网的商品搜索