Hỏi về tích hợp OpenNLP cho Solr

Hienbkkt22 · December 4, 2018, 2:03pm

Xin chào các bạn,
Tôi đang làm 1 ứng dụng search(tiếng Việt) cho Solr, vì đặc thù là tiếng việt nên có từ đơn và từ ghép, nên t muốn tách từ cho văn bản (tokenize)
T dùng OpenNLP Tokenizer nhưng khi add lib như sau:

  <lib dir="${solr.install.dir:../../../..}/contrib/analysis-extras/lucene-libs" regex=".*\.jar" />
  <lib dir="${solr.install.dir:../../../..}/contrib/analysis-extras/lib" regex="opennlp-.*\.jar" />

và sử dụng class trong phần khai báo field như sau:

    <tokenizer class="solr.OpenNLPTokenizerFactory"
    	sentenceModel="vi-sent.bin"
    	tokenizerModel="vi-token.bin"/>

(2 model vi-sent,vi-token đã được train)
Nhưng khi chạy thử Solr thì báo lỗi:

solrAnalyzer: org.apache.solr.common.SolrException:org.apache.solr.common.SolrException: Could not load conf for core solrAnalyzer: Can't load schema D:\xampp\htdocs\Vietnam Wikipedia Search Engine\solr-7.5.0\solr-7.5.0\server\solr\solrAnalyzer\conf\managed-schema: null

Ai biết về vấn đề này giúp đỡ t với,mọi câu trả lời đều rất quý giá
Cảm ơn

Hienbkkt22 · December 4, 2018, 2:40pm

Đây là ảnh các file jar đc add vào lib

Trước khi t add lib của OpenNLP thì Solr server vẫn chạy bình thường, nhưng sau khi add thì báo lỗi như trên