lucene4.7收集器Collector怎么自定义-快上网网站建设公司

lucene4.7收集器Collector怎么自定义

本篇内容介绍了“lucene4.7收集器Collector怎么自定义”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！

创新互联-专业网站定制、快速模板网站建设、高性价比蒙城网站开发、企业建站全套包干低至880元,成熟完善的模板库,直接使用。一站式蒙城网站制作公司更省心,省钱,快速模板网站建设找我们，业务覆盖蒙城地区。费用合理售后完善，10多年实体公司更值得信赖。

lucene4.7收集器Collector怎么自定义

我们先来回顾下，一个基本的搜索流程是怎么完成的
1，得到一个索引目录Directory(可能基于内存的或者磁盘的)。
2，得到一个DirectoryReader。
3，实例化查询组件IndexSearcher。
4，检索得到TopDoc查询结果集
5,遍历ScoresDocs处理结果

我们看下这个检索的流程，大概可以分这5步，前1,2,3算是准备工作，后面的2步是我们经常需要进行数据处理的地方，那么我们Collector到底工作在哪一步呢？，其实Collector真正的起作用是在3-4步之间的。

那么Collector的作用是干什么的？为什么需要使用Collector？

在这之前先分析下TopDocs这个类，这个类的工作原理，其实在后台使用的也是一个收集器，收收集我们检索的结果，通过TopDocsCollector这个基类下面的2个子类收集器，来收集一次我们检索的命中数据。
所以collector的作用就是收集某些我们需要定制化的结果集，某些情况下使用collector可以可以极大的提升我们程序的性能，通过collector可以让我们对每一个匹配上的文档做一些特有的定制化操作，当然前提是在我们需要使用的情况下。
下面我们来看下collector基类的几个方法

方法	说明
collect()	检索时，每匹配上一个文档，都会调用此方法
acceptsDocsOutOfOrder()	测试本collector是否能处理无序到达的docid
setScorer(Scorer scorer)	处理检索结果的评分
setNextReader(AtomicReaderContext context)	检索时，在多个索引段结构之间切换的方法

下面我们来看下自定义的一个collector来实现ScoreDoc类的功能,代码如下.

package com.piaoxuexianjing;

import java.io.IOException;
import java.util.ArrayList;
import java.util.List;

import org.apache.lucene.index.AtomicReaderContext;
import org.apache.lucene.search.Collector;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.Scorer;

/**
 * @author
 * @version 1.0
 * 
 * 自定义收集器
 * 实现评分收集
 * **/
public class MyScoreCollector extends Collector {
    //private HashMap documents=new HashMap();
    List docs=new ArrayList();
    private Scorer scorer;//scorer类
    private int docBase;//全局相对段基数
     

    @Override
    public boolean acceptsDocsOutOfOrder() {
        // TODO Auto-generated method stub
        //返回true是允许无次序的ID
        //返回false必须是有次序的
        return true;
    }

    @Override
    public void collect(int arg0) throws IOException {
        /**
         * 匹配上一个文档
         * 就记录其docid与打分情况
         * 
         * */
        docs.add(new ScoreDoc(arg0+docBase,scorer.score()));//
    }
//    BinaryDocValues names;//字符类型的内置存储
//    BinaryDocValues bookNames;//字符类型的内置存储
//    BinaryDocValues ids;//字符类型的内置存储
//    BinaryDocValues prices;//字符类型的内置存储
//    FieldCache.Doubles d ; //数值类型的内置存储
//    FieldCache.Ints ints;//数值类型的内置存储
    @Override
    public void setNextReader(AtomicReaderContext arg0) throws IOException {
        this.docBase=arg0.docBase;//记录每个索引段结构的相对位置
    }

    @Override
    public void setScorer(Scorer arg0) throws IOException {
        // TODO Auto-generated method stub
        this.scorer=arg0;//记录改匹配的打分情况
        
    }
}

测试类的核心代码

    //自定义收集器
           MyScoreCollector  scoreCollector=new MyScoreCollector();
          searcher.search(new MatchAllDocsQuery(), scoreCollector);
          /**
           * 自定义的收集类，实现效果===>ScoreDocs类
           * 
           **/
          List s=scoreCollector.docs;
          for(ScoreDoc sc:s){
              System.out.println(sc.doc+"===="+sc.score);
          }

输出结果如下

0====1.0
1====1.0
2====1.0
3====1.0
4====1.0
5====1.0
6====1.0
7====1.0

“lucene4.7收集器Collector怎么自定义”的内容就介绍到这里了，感谢大家的阅读。如果想了解更多行业相关的知识可以关注创新互联网站，小编将为大家输出更多高质量的实用文章！

当前题目：lucene4.7收集器Collector怎么自定义
URL地址：http://cdkjz.cn/article/jcseeg.html

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

lucene4.7收集器Collector怎么自定义

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

lucene4.7收集器Collector怎么自定义

相关资讯

路由器设置中国电信 路由器怎么设置电信

插卡式路由器 插卡式路由器可以传输多远

阿里云服务器地区有区别 阿里云服务器地域

java多态的代码例子 java多态经典例子

tpling路由器设置登录 tplink路由器怎么设置登录密码

java网页代码 java编写网站代码

linux文件内剪切命令 linux命令剪切文件

腾讯云服务器有容量限制吗 腾讯云服务器带宽多少合适

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

路由器设置中国电信路由器怎么设置电信

插卡式路由器插卡式路由器可以传输多远

阿里云服务器地区有区别阿里云服务器地域

腾讯云服务器有容量限制吗腾讯云服务器带宽多少合适

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接