`

一、初步认识lucene

 
阅读更多

环境搭建:

1、lucene-core-3.5.0.jar

2、mmseg4j-all-1.8.5-with-dic.jar(中文分词器)

3、lucene-highlighter-3.5.0.jar、lucene-memory-3.5.0.jar(高亮显示)

 

在全文索引工具中,都是由这样的三部分组成
  1、索引部分(I am a boy)
  2、分词部分
  3、搜索部分

 

    /**


	 * 建立索引


	 */


	public void index() {


		


		//1、创建Directory


		//Directory directory = new RAMDirectory();//建立在内存中


		Directory directory = null;


		try {


			directory = FSDirectory.open(new File("D:/test/index01"));


		} catch (IOException e1) {


			e1.printStackTrace();


		}


		//2、创建IndexWriter


		IndexWriterConfig config = new IndexWriterConfig(Version.LUCENE_36, new StandardAnalyzer(


			Version.LUCENE_36));


		IndexWriter writer = null;


		


		try {


			writer = new IndexWriter(directory, config);


			


			//3、创建Document对象


			Document document = null;


			//4、为Document添加Field


			Collection<File> files = FileUtils.listFiles(new File("D:/test/lucene"),


				FileFileFilter.FILE, null);


			for (File file : files) {


				document = new Document();


				document.add(new Field("content", new FileReader(file)));


				document.add(new Field("filename", file.getName(), Field.Store.YES,


					Field.Index.NOT_ANALYZED));


				document.add(new Field("path", file.getAbsolutePath(), Field.Store.YES,


					Field.Index.NOT_ANALYZED));//是否存储路径,是否进行分词


				


				writer.addDocument(document);


			}


			


			//5、通过IndexWriter添加对象到索引中


		} catch (CorruptIndexException e) {


			e.printStackTrace();


		} catch (LockObtainFailedException e) {


			e.printStackTrace();


		} catch (IOException e) {


			e.printStackTrace();


		} finally {


			if (writer != null) {


				try {


					writer.close();


				} catch (CorruptIndexException e) {


					e.printStackTrace();


				} catch (IOException e) {


					e.printStackTrace();


				}


			}


		}


		


	}


	


	/**


	 * 搜索


	 */


	public void searcher() {


		


		try {


			//1、创建Directory


			Directory directory = FSDirectory.open(new File("D:/test/index01"));


			//2、创建IndexReader


			IndexReader reader = IndexReader.open(directory);


			//3、根据IndexReader创建IndexSearcher


			IndexSearcher searcher = new IndexSearcher(reader);


			//4、创建搜索的Query


			QueryParser parser = new QueryParser(Version.LUCENE_36, "content",


				new StandardAnalyzer(Version.LUCENE_36));//content表示搜索的Field


			Query query = parser.parse("File");//表示内容中含有“File”的


			//5、根据searcher搜索并返回TopDocs


			TopDocs topDocs = searcher.search(query, 10);//只搜索10条


			//6、根据TopDocs对象获取ScoreDoc对象


			ScoreDoc[] sds = topDocs.scoreDocs;


			for (ScoreDoc scoreDoc : sds) {


				//7、根据searcher和ScoreDoc对象获取具体的Document对象


				Document document = searcher.doc(scoreDoc.doc);


				//8、根据Document对象获取需要的值


				System.out.println(document.get("filename"));


				System.out.println(document.get("path"));


			}


			


			//9、关闭reader


			reader.clone();


		} catch (Exception e) {


			e.printStackTrace();


		}


	}
分享到:
评论

相关推荐

    lucene,lucene教程,lucene讲解

    Directory类代表一个Lucene索引的位置。它是一个抽象类. 其中的两个实现: 第一个是 FSDirectory,它表示一个存储在文件系统中的索引的位置。 第二个是 RAMDirectory,它表示一个存储在内存当中的索引的位置。 ...

    lucene实例lucene实例

    lucene实例lucene实例lucene实例lucene实例lucene实例lucene实例lucene实例lucene实例lucene实例

    Lucene in Action 中文版

    使用其他编程语言访问Lucene Lucene管理和性能调优等内容 最后还提供了三大经典成功案例 为读者展示了一个奇妙的搜索世界  《Lucene实战 第2版 》适合于已具有一定Java编程基本的读者 以及希望能够把强大的搜索...

    Lucene实战

    包括认识Lucene、建立索引、为应用程序添加搜索功能、高级搜索技术、扩展搜索、使用Tika提取文本、Lucene的高级扩展、使用其他编程语言访问Lucene、Lucene管理和性能调优等内容,最后还提供了三大经典成功案例,为...

    lucene3.0 lucene3.0

    lucene3.0 lucene3.0 lucene3.0 lucene3.0 lucene3.0

    比较全面的一个入门 lucene

    比较全面的一个入门 比较全面的一个入门 比较全面的一个入门 比较全面的一lucene个入门 比较全面的一个入门

    lucene学习lucene学习

    lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习lucene学习...

    一个基于LUCENE搜索引擎项目例子

    一个基于LUCENE搜索引擎项目例子一个基于LUCENE搜索引擎项目例子一个基于LUCENE搜索引擎项目例子

    一种基于Lucene检索引擎的全文数据库的研究与实现

    一种基于Lucene检索引擎的全文数据库的研究与实现一种基于Lucene检索引擎的全文数据库的研究与实现一种基于Lucene检索引擎的全文数据库的研究与实现

    Lucene in action(中文版)

    包括认识Lucene、建立索引、为应用程序添加搜索功能、高级搜索技术、扩展搜索、使用Tika提取文本、Lucene的高级扩展、使用其他编程语言访问Lucene、Lucene管理和性能调优等内容,最后还提供了三大经典成功案例,为...

    Lucene3.0特性,Lucene3.0特性

    Lucene3.0特性Lucene3.0特性

    lucene例子(一个完整的,lucene例子)(lucenetest.rar,lucene,全文检索,lucene例子)

    lucenetest.rar,lucene,全文检索,lucene例子 lucenetest.rar,lucene,全文检索,lucene例子lucenetest.rar,lucene,全文检索,lucene例子

    Lucene4.X第九讲-Lucene搜索深入实战

    Lucene是一个高性能、可伸缩的信息搜索(IR)库。目前最新版本是4.3.1. 它可以为你的应用程序添加索引和搜索能力。Lucene是用java实现的、成熟的开源项目,是著名的Apache Jakarta大家庭的一员,并且基于Apache软件...

    论文研究-一种融合词语位置特征的Lucene相似度评分算法.pdf

    相似度评分算法是Lucene引擎中的核心部分之一。对Lucene内部的相似度评分算法进行研究分析后,针对Lucene只关心查询词出现的频率,而不关心它们所在的位置这一缺陷提出了一种改进的算法。改进的算法将词语位置关系...

    lucene讲义 叫你用lucene算法

    lucene学习教程lucene讲义 叫你用lucene算法

    java Lucene初级教程

     Lucene是一个全文搜索框架,而不是应用产品。因此它并不像www.baidu.com 或者google Desktop那么拿来就能用,它只是提供了一种工具让你能实现这些产品。 2 lucene的工作方式  lucene提供的服务实际包含两部分:一...

    lucene详细使用教程

    lucene

    lucene3源码分析

    lucene3源码分析

    lucene6.6jar包

    lucene

    lucene3.0-lib

    Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎...

Global site tag (gtag.js) - Google Analytics