网站建设 >

查看其它板块

java中solr代码 java sop

java web 怎么用solr

我们下载的Solr包后，进入Solr所在的目录，我们可以看到以下几个目录：build、client、dist、example、lib、site、src。下面分别对其进行介绍。

成都创新互联公司坚持“要么做到，要么别承诺”的工作理念，服务领域包括：成都网站建设、做网站、企业官网、英文网站、手机端网站、网站推广等服务，满足客户于互联网时代的安塞网站设计、移动媒体设计的需求，帮助企业找到有效的互联网解决方案。努力成为您成熟可靠的网络建设合作伙伴！

1) build：该目录是在ant build过程中生成的，其中包含了未被打包成jar或是war的class文件以及一些文档文件。

2) client：该目录包含了特定语言的Solr客户端API，使得使用其他语言的用户能通过HTTP用XML与Solr进行通话。现在该目录里面虽然包含javascript、python、ruby三个子目录，但是到目前为止只包含一部分的ruby的代码，其他语言仍是空的。另外，Solr的Java客户端称为SolrJ，其代码位于src/solrj目录下面。在之后的文章中我会详细介绍Solr客户端的使用。

3) dist：该目录包含build过程中产生的war和jar文件，以及相关的依赖文件。还记得上一篇文章中，我们在build 1.4版本的Solr源代码后需要部署example吗？其实就是将该目录下面的apache-solr-1.4.war部署到Jetty上面去，并重命名为solr.war。

4) example：这个目录实际上是Jetty的安装目录。其中包含了一些样例数据和一些Solr的配置。

其中一些子目录也比较重要，这里也对它们稍作介绍。

l example/etc：该目录包含了Jetty的配置，在这里我们可以将Jetty的默认端口从8983改为80端口。

l 将其中的8983端口换成80端口。注意更改端口后启动Jetty可能会提示你没有权限，你需要使用sudo java -jar start.jar来运行。

l example/multicore：该目录包含了在Solr的multicore中设置的多个home目录。在之后的文章中我会对其进行介绍。

l example/solr：该目录是一个包含了默认配置信息的Solr的home目录。

详见下面的“solr home说明”

l example/webapps：Jetty的webapps目录，该目录通常用来放置Java的Web应用程序。在Solr中，前面提到的solr.war文件就部署在这里。

5) lib：该目录包含了所有Solr的API所依赖的库文件。其中包括Lucene，Apache commons utilities和用来处理XML的Stax库。

6) site：该目录仅仅包含了Solr的官网的网页内容，以及一些教程的PDF文档。

7) src：该目录包含了Solr项目的整个源代码。这里对其各个子目录也做相应的介绍。

l src/java：该目录存放的是Solr使用Java编写的源代码。

l src/scripts：该目录存放的是配置Solr服务器的Unix BashShell脚本，在后面介绍多服务器配置中将会有重要的作用。

l src/solrj：前面提到过该目录存放的是Solr的Java版本的客户端代码。

l src/test：该目录存放的是测试程序的源代码和测试文件。

l src/webapp：该目录存放的是管理Solr的Web页面，包括Servlet和JSP文件，其构成了前面提到的WAR文件。管理Solr的JSP页面在web/admin目录下面，如果你有兴趣折腾Solr可以找到相应的JSP的页面对其进行设置

1.4.2 Solr home说明

所谓的Solr home目录实际上是一个运行的Solr实例所对应的配置和数据（Lucene索引）。在上一篇文章中我提到过在Solr的example/solr目录就是一个Solr用做示例的默认配置home目录。实际上example/multicore也是一个合法的Solr home目录，只不过是用来做mult-core设置的。那么我们来看看example/solr这个目录里面都有些什么。

example/solr目录下主要有以下一些目录和文件：

1) bin：如果你需要对Solr进行更高级的配置，该目录建议用来存放Solr的复制脚本。

2) conf ：该目录下面包含了各种配置文件，下面列出了两个最为重要的配置文件。其余的.txt和.xml文件被这两个文件所引用，如用来对文本进行特殊的处理。

l conf/schema.xml：该文件是索引的schema，包含了域类型的定义以及相关联的analyzer链。

l conf/solrconfig.xml：该文件是Solr的主配置文件。

l conf/xslt：该目录包含了各种XSLT文件，能将Solr的查询响应转换成不同的格式，如：Atom/RSS等。

3) data：包含了Lucene的二进制索引文件。

4) lib：该目录是可选的。用来放置附加的Java JAR文件，Solr在启动时会自动加载该目录下的JAR文件。这就使得用户可以对Solr的发布版本（solr.war）进行扩展。如果你的扩展并不对Solr本身进行修改，那么就可以将你的修改部署到JAR文件中放到这里。

Solr是如何找到运行所需要的home目录的呢？

Solr首先检查名为solr.solr.home的Java系统属性，有几种不同的方式来设置该Java系统属性。一种不管你使用什么样的Java应用服务器或Servlet引擎都通用的方法是在调用Java的命令行中进行设置。所以，你可以在启动Jetty的时候显式地指定Solr的home目录java -Dsolr.solr.home=solr/ -jar start.jar。另一种通用的方法是使用JNDI，将home目录绑定到java:comp/env/solr/home。并向src/webapp/web/WEB-INF/web.xml添加以下一段代码：

1 env-entry

2 env-entry-namesolr/home/env-entry-name

3 env-entry-valuesolr//env-entry-value

4 env-entry-typejava.lang.String/env-entry-type

5 /env-entry

实际上这段XML在web.xml文件中已经存在，你只需要把原来注释掉的xml取消注释，添加你所要指向的home目录即可。因为修改了web.xml文件，所以你需要运行antdist-war来重新打包之后再部署WAR文件。

最后，如果Solr的home目录既没有通过Java系统属性指定也没有通过JNDI指定，那么他将默认指向solr/。

在产品环境中，我们必须设置Solr的home目录而不是让其默认指向solr/。而且应该使用绝对路径，而不是相对路径，因为你有可能从不同的目录下面启动应用服务器。

注：Jetty 是一个开源的servlet容器，它为基于Java的web内容，例如JSP和servlet提供运行环境。Jetty是使用Java语言编写的，它的API以一组JAR包的形式发布。开发人员可以将Jetty容器实例化成一个对象，可以迅速为一些独立运行（stand-alone）的Java应用提供网络和web连接。

我们先从使用者的角度出发，最先看到的当然是servlet,因为Solr本身是个独立的网络应用程序，需要在Servlet容器中运行来提供服务，所以servlet是用户接触的最外层。我们看看org.apache.solr.servlet包。这个包很简单，只有两个类：SolrServlet和SolrUpdateServlet.我们很容易从类名中猜出这两个类的用途。

SolrServlet类继承HttpServlet类，只有四个方法：

· init()

· destroy()

· doGet()

· doPost()

SolrServlet类中除了普通的Java类对象（包括Servlet相关的）外，有四个Solr本身的类，还有一个Solr本身的异常。其中两个类和一个异常属于org.apache.solr.core包，两个类属于org.apache.solr.request包。属于core包的有：

· Config:

· SolrCore:

属于request包的有：

· SolrQueryResponse:

· QueryResponseWriter:

分析一下这个SolrServlet类。首先servlet会调用init()方法进行初始化：通过Context查找java:comp/env/solr/home来确定Solr的主目录（home），接着调用Config.setInstanceDir(home)方法设置这个实例的目录。然后通过SolrCore.getSolrCore()来获得一个SolrCore实例。destroy()方法将会在Servlet对象销毁时调用，仅仅调用core.close()关闭SolrCore实例。

当用户请求进来时doPost()简单地将任务交给doGet()完成，主要的任务由doGet()完成。分析一下doGet()方法：

1) 使用SolrCore和doGet()参数request生成一个SolrServletRequest对象(注意：这个SolrServletRequest类不是公开类，位于org.apache.solr.servlet包中，继承了SolrQueryRequestBase类，仅仅接受SolrCore和HttpServletRequest对象作为参数)

2) 然后SolrCore执行execute()方法（参数为SolrServletRequest和SolrQueryResponse）

由此可见，真正的处理核心是SolrCore的execute方法

怎么用java代码操作solr对数据库进行索引

SolrQuery solrQuery = new SolrQuery(); Map map = new HashMap(); map.put(FacetParams.FACET_DATE, "manufacturedate_dt"); map.put(FacetParams.FACET_DATE_START,"2004-01-01T00:00:00Z"); map.put(FacetParams.FACET_DATE_END,"2010-01-01...

java怎么调用solr查询接口

solr官方网站

下面是一个例子：

import org.apache.solr.client.solrj.SolrServer;

import org.apache.solr.client.solrj.SolrServerException;

import org.apache.solr.client.solrj.impl.CommonsHttpSolrServer;

import org.apache.solr.client.solrj.response.QueryResponse;

import org.apache.solr.common.SolrDocument;

import org.apache.solr.common.params.ModifiableSolrParams;

import java.net.MalformedURLException;

public class Main {

public static void main(String[] args) throws MalformedURLException, SolrServerException {

SolrServer server = new CommonsHttpSolrServer("");

ModifiableSolrParams params = new ModifiableSolrParams();

// 查询关键词

params.set("q", "2010");

// 分页，，start=0就是从0开始，，rows=5当前返回5条记录，，，第二页就是变化start这个值为5就可以了。

params.set("start", 0);

params.set("rows", 5);

// 排序，，如果按照id 排序，，那么将score desc 改成 id desc(or asc)

params.set("sort", "score desc");

// 返回信息 * 为全部这里是全部加上score，如果不加下面就不能使用score

params.set("fl", "*,score");

QueryResponse response = server.query(params);

// 搜索得到的结果数

System.out.println("Find:"+ response.getResults().getNumFound()+"\n\n");

// 输出结果

for(SolrDocument doc:response.getResults())

{

System.out.println("id: " + doc.getFieldValue("id").toString());

System.out.println("title: " + doc.getFieldValue("title").toString()+"\n");

}

solr3.5中如何用java代码为PDF，Office等文件添加索引

1、将解压包中的solr-4.7.1/dist/solr-4.7.1.war复制到tomcat_dir/webapps/目录，并命名为solr.war。

2、将solr-4.7.1/example/lib/ext/目录下的jar文件复制到tomcat/lib目录下，将solr-4.7.1/example/resources/下的log4j.properties文件复制到tomcat_dir/lib目录下;

切把 solr-4.7.1/example/solr，复制到tomcat_dir/bin下。

3、修改tomcat_dir/conf/server.xml

Connector port="8080" protocol="HTTP/1.1"

connectionTimeout="20000"

redirectPort="8443"

URIEncoding="UTF-8" /

4、创建solr.xml，存放在路径：tomcat/conf/Catalina/localhost/solr.xml，内容：

Context path="/solr" docBase="C:\Tomcat 7.0\webapps\solr.war"

debug="0" crossContext="true"

Environment name="solr/home" type="java.lang.String" value="C:\Tomcat 7.0\bin\solr\" override="true" /

/Context

PS：上面的docBase和value路径中不能存在中文字符，否则会出现404错误。

5、将C:\Tomcat 7.0\webapps下的solr.war包，启动项目解压；然后再添加几个jar包：

solr-4.7.1\dist\solr-dataimporthandler-4.7.1.jar;

solr-4.7.1\dist\solr-dataimporthandler-extras-4.7.1.jar;

还要加载数据库驱动包：mysql-connector-java-3.1.13-bin.jar

6、在C:\Tomcat 7.0\bin\solr\collection1\conf 下的solrconfig.xml增加以下数据库配置：

requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler"

lst name="defaults"

str name="config"data-config.xml/str

/lst

/requestHandler

7、将tomcat\bin\solr\collection1\conf下增加data-config.xml文件，内容如下：

dataConfig

dataSource type="JdbcDataSource"

driver="com.mysql.jdbc.Driver"

url="jdbc:mysql://192.168.1.221:3306/tmsdb"

user="root"

password="123456"/

document name="content"

entity name="node" query="select id,author,title,content from solrdb"

field column="id" name="id" /

field column="author" name="author" /

field column="title" name="title" /

field column="content" name="content" /

/entity

/document

/dataConfig

8、增加中文分词器，ik-analyzer的配置如下：

①目前的中文分词主要有两种

1，基于中科院ICTCLAS的隐式马尔科夫hhmm算法的中文分词器，例如smartcn等。（不支持自定义扩展词库）

2，基于正向迭代最细粒度切分算法（正向最大匹配并且最细分词）例如IK，庖丁等（支持自定义扩展词库）

安装分词前，可以去下载IK的分词包：

IK-Analyzer-4.7.1-0.0.1-SNAPSHOT.jar

下载完毕后，将此包放进tomcat\solr的\WEB-INF\lib下面：tomcat\webapps\solr\WEB-INF\lib 。

下面需要在solr的schemal.xml进行分词器注册:

!-- 配置IK分词器 --

fieldType name="text_ik" class="solr.TextField" positionIncrementGap="100"

analyzer type="index"

!-- 分词--

tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory"/

!-- 禁用词过滤根据情况使用--

!-- filter class="org.wltea.analyzer.lucene.IKStopFilterFactory"/ --

/analyzer

analyzer type="query"

!-- 分词--

tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory"/

!-- 禁用词过滤根据情况使用--

!-- filter class="org.wltea.analyzer.lucene.IKStopFilterFactory"/--

/analyzer

/fieldType

最后还得配置一个引用字段就OK了

field name="ik" type="text_ik" indexed="true" stored="true" multiValued="true"/

②它的安装部署十分简单，将IKAnalyzer2012.jar部署亍项目的lib目录中；IKAnalyzer.cfg.xml不stopword.dic文件放置在class根目录（对于web项目，通常是WEB-I NF/classes目彔，同hibernate、log4j等配置文件相同）下即可；然后配置solr4.7中schema.xml配置解析器：

schema name="example" version="1.1"

……

fieldType name="text" class="solr.TextField"

analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/

/fieldType

……

/schema

分享名称：java中solr代码 java sop
分享URL：http://cdkjz.cn/article/dopheee.html

返回首页了解更多建站资讯

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

大客户专线成都：13518219792 座机：028-86922220

在线咨询提交需求

友情链接交换友情链接

公司形象墙 IDC机房托管服务器租用企业网页设计成都网站设计免费收录网站服务器托管钢筋机械设备江油网站建设 h5页面制作

成都网站建设公司地址：成都市青羊区太升南路288号锦天国际A座10层建设咨询028-86922220

专家团队为您提供成都网站建设,成都网站设计,成都品牌网站设计,成都营销型网站制作等服务,成都建网站就找快上网！ | 成都网站建设哪家好？ | 网站建设地图

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

java中solr代码 java sop

java web 怎么用solr

怎么用java代码操作solr对数据库进行索引

java怎么调用solr查询接口

solr3.5中如何用java代码为PDF，Office等文件添加索引

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

java中solr代码 java sop

java web 怎么用solr

怎么用java代码操作solr对数据库进行索引

java怎么调用solr查询接口

solr3.5中如何用java代码为PDF，Office等文件添加索引

相关资讯

抖音探店分成比例介绍（运营者必看如何获取更多收益）

抖音探店怎么做可以赚到钱？

清远短视频运营平台

短视频代运营直播卖货技巧

短视频运营光明

日照短视频运营代运营

长宁抖音代运营价格

澜沧短视频代运营技术公司

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接