读书人

solr汉语言分词(mmseg4j)

发布时间: 2012-06-27 14:20:09 作者: rapoo

solr中文分词(mmseg4j)

1、从http://code.google.com/p/mmseg4j/??? 下载mmseg4j

solr汉语言分词(mmseg4j)

?

2、在$SOLR_HOME下建立lib和dic两个目录,讲mmseg4j-all-1.8.4.jar拷贝到lib目录,将data里的.dic文件拷贝到dic目录

?

3、修改Schema.xml

添加fieldType

?
?

?

重启tomcat


进入 http://yourhost:8080/solr-example/admin/analysis.jsp

solr汉语言分词(mmseg4j)

?

哦也,我们的中文分词大功告成了

?

我们试着提交些中文到solr里,然后进行查询

solr汉语言分词(mmseg4j)

?

?

接下来我们试着查询一下:

solr汉语言分词(mmseg4j)

?

查询结果

?可能会遇到的问题:

1、在Query String:输入中文时候会乱码导致查询不到结果

解决办法:修改tomcat的server.xml

<Server ...> <Service ...>   <Connector ... URIEncoding="UTF-8"/>     ...   </Connector> </Service></Server>
?

?

读书人网 >开源软件

热点推荐