solr学习-单机配置solr环境

haiwei2009

浏览: 140192 次
性别:
来自: 北京

最近访客更多访客>>

子不语

x3140412017

778226397

zhaoxiaoxiao

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

solr

转载http://www.douban.com/note/331756147/
windows linux mac安装过程都是类似的，jdk6和tomcat7的安装省略了，下面说明solr-4.7单机安装步骤
solr4.7是最后一个用jdk6的版本，从solr4.8开始用jdk7版本了

1.去apache官网下载solr-4.7，解压

4. slor安装至tomcat

a. 将该文件夹下面examples下的slor文件夹复制到f:\tomcat下面，作为solr的home目录
该solr目录也可以不放在这，也可以单独放到其他目录，只要在下面d步骤中配置好即可

b. 将该文件夹下面webapps下的solr.war复制到tomcat的webapps目录下，war包在tomcat启动后会自动解压出来

c. 配置solr的data目录，打开f:/tomcat/solr/collection1/conf/solrconfig.xml，修改datadir：

引用

<dataDir>${solr.data.dir:F:\tomcat\solr\data}</dataDir>

d. 将solr.war注册给tomcat，在f:/tomcat/conf/Catalina/localhost/下创建solr.xml:

引用

<?xml version="1.0" encoding="UTF-8"?>

<Context docBase="f:/tomcat/webapps/solr" debug="0" crossContext="true" >
<Environment name="solr/home" type="java.lang.String" value="f:/tomcat/solr" override="true" />
</Context>

e. 防止乱码的在tomcat/conf/server.xml中加入;
[html] view plaincopy
<Connector port="8080" protocol="HTTP/1.1"
           connectionTimeout="20000"
           redirectPort="8443"
           URIEncoding="UTF-8"/>

f. 将F:\solr\example\lib\ext下的5个jar包和F:\solr\example\resources下的log4j放入tomcat的lib目录下
g. 重新启动tomcat，浏览器中输入：http://localhost:8080/solr：

http://martin3000.iteye.com/blog/807503

中文分词器安装
   中文分词在solr里面是没有默认开启的，需要我们自己配置一个中文分词器。目前可用的分词器有smartcn，IK，jeasy，庖丁。其实主要是两种，一种是基于中科院ICTCLAS的隐式马尔科夫HMM算法的中文分词器，如smartcn，ictclas4j，优点是分词准确度高，缺点是不能使用用户自定义词库；另一种是基于最大匹配的分词器，如IK ，Jeasy，庖丁，优点是可以自定义词库，增加新词，缺点是分出来的垃圾词较多。各有优缺点，看应用场合自己衡量选择吧。

配置ik分词
将IK Analyzer 2012FF_hf1发行包解压,复制IKAnalyzer2012FF_u1.jar到Solr的lib中，如/home/tomcat/webapps/solr/WEB-INF/lib，复制配置文件IKAnalyzer.cfg.xml和ext_stopword.dic到/home/tomcat/webapps/solr/WEB-INF/classes目录中

打开solr/collection1/conf目录，编辑scheme.xml文件,添加下面xml代码

引用

并且将该文件中的

引用

改成

引用

在扩展词汇时修改IKAnalyzer.cfg.xml文件配置即可，注意修改文件stopword.dic，ext.dic的编码方式为无BOM的UTF-8编码方式
转载http://blog.csdn.net/shihuacai/article/details/8494360

配置SmartChinese分词
将contrib/analysis-extras/lucene-libs/lucene-smartcn-3.5.0.jar复制到/tomcat/webapps/solr/WEB-INF/lib，
打开/tomcat/bin/solr/conf/scheme.xml，编辑text字段类型如下，添加以下代码到shema中的相应位置，就是找到fieldType定义的那一段，在下面多添加

引用

分享到：

yum命令Header V3 RSA/SHA1 Signature, ke ... | web开发设置Tomcat中文编码

2014-06-19 08:42
浏览 1483
评论(0)
分类:互联网
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

solr单机部署: Solr是一个全文检索服务器，它基于Lucene实现，Solr只需要进行配置就可以实现全文检索服务。此文档参考培训机构资料，适合初学者参考使用。

springboot-solr-demo:Solr单机版配置，以及springboot和solr集成: springboot-solr-demoSolr单机版配置，以及springboot和solr集成solr-4.10.3solr4.10.31: 安装说明，以及中文词库配置说明等solr：webapp，将该目录放到tomcat webapps 下可以直接运行无需过多配置。solr-6.6.6solr...

solr安装配置（单核、多核）: 给出了solr的安装配置说明，分单核和多核两部分

spring-solr.zip: Spring-4.x+Solr-4.10.3+spring-data-solr-1.5.5.RELEASE整合配置配置、包含单机版及相关集群配置及操作代码示例

windows-solr集群.docx: 内涵solr单机，solr windows集群，solr linux集群搭建方法，中文分词，数据同步增量配置等

solr4.5单机版+中文分词的部署: solr4.5下载、解压、部署说明，tomcat部署说明，IK中文分词部署说明

solr_7.0.0.pdf solr7的英文文档: 这本资料介绍了solr的单机模式，集群模式的安装和配置，以及一些和java等语言的集成。以及更新旧版本solr引擎的说明等等

solr6+ik相关知识总结: 单机版solr6的安装及ik中文分词器的配置，solr的简单介绍及solrj的简单应用

分布式全文检索系统SolrCloud简介: Solr可以以多种方式部署，例如单机方式，多机Master-Slaver方式，这些方式部署的Solr不具有SolrCloud的特色功能。SolrCloud有几个特色功能：使用ZK进行集中配置。启动时可以指定把Solr的相关配置文件上传

scen-springcloud-store:springcloud高可用分布式商城: solr单机版8082 zookeeper集群2881:3881-2883:3883 solr集群6060-6063 ftp图片服务器21 nginx代理图片路径9090 阿波罗配置中心 config-server8080 admin-server8090 portal8070 消息队列服务器 4369 5672,5671 25672...

solrcloud-zookeeper-kubernetes:在Kubernetes环境中运行Solrcloud和Zookeeper: 一个（或多个）Solr实例和一个Zookeeper配置为“独立”节点一个（或多个）Solr实例和一个Zookeeper集成体（意味着一个集群） Zookeeper配置（以及与Solr的交互）是项目中最难的部分。需要指出的是，Zookeeper...

Eclipse开发分布式商城系统+完整视频代码及文档: │ 10.solr单机版安装.avi │ 11.中文分析器配置.avi │ 12.导入数据-dao.avi │ 13.索引库导入数据-完成.avi │ 淘淘商城第七天笔记.doc │ ├─08.第八天 │ 14.搜索服务切换到集群.avi │ 01.课程计划.avi │ 02...

analysis-ik-online:IKAnalyzer多分词配置、在线词典管理和热重载: 为便于开发调试，项目中直接集成了Solr和Elasticsearch的单机、集群调试功能，可直接在IDE中运行。通过调整以下参数可实现不同分词效果： 1. dictSerial：词典编码，用于区分不同词典 2. useSmart：是否采用细粒度...

boot-single:boot-single基于SpringBoot2.0.2版本，结合项目实用的技术点。采用技术：Redisson，SolrCloud，RedisCluster，ElasticJob，Druid，Mybatis，Freemarker等，帮助您急速上手使用SpringBoot。【QQ群：759111321，作者QQ: 默认配置下，用户仅需要自己配置单机mysql和redis组件，就可以快速启动项目。技术选型 ● 系统核心框架：SpringBoot ● 定时任务调度：ElasticJob+Zookeeper ● 数据持久框架：MyBatis ● 数据库连接池：Alibaba ...

JAVA上百实例源码以及开源项目源代码: 　Java数据压缩与传输实例，可以学习一下实例化套按字、得到文件输入流、压缩输入流、文件输出流、实例化缓冲区、写入数据到文件、关闭输入流、关闭套接字关闭输出流、输出错误信息等Java编程小技巧。 Java数组倒置...

JAVA上百实例源码以及开源项目: 笔者当初为了学习JAVA，收集了很多经典源码，源码难易程度分为初级、中级、高级等，详情看源码列表，需要的可以直接下载！这些源码反映了那时那景笔者对未来的盲目，对代码的热情、执着，对IT的憧憬、向往！此时此...

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论