Xin chào các bạn,
Tôi đang làm 1 ứng dụng search(tiếng Việt) cho Solr, vì đặc thù là tiếng việt nên có từ đơn và từ ghép, nên t muốn tách từ cho văn bản (tokenize)
T dùng OpenNLP Tokenizer nhưng khi add lib như sau:
<lib dir="${solr.install.dir:../../../..}/contrib/analysis-extras/lucene-libs" regex=".*\.jar" />
<lib dir="${solr.install.dir:../../../..}/contrib/analysis-extras/lib" regex="opennlp-.*\.jar" />
và sử dụng class trong phần khai báo field như sau:
<tokenizer class="solr.OpenNLPTokenizerFactory"
sentenceModel="vi-sent.bin"
tokenizerModel="vi-token.bin"/>
(2 model vi-sent,vi-token đã được train)
Nhưng khi chạy thử Solr thì báo lỗi:
solrAnalyzer: org.apache.solr.common.SolrException:org.apache.solr.common.SolrException: Could not load conf for core solrAnalyzer: Can't load schema D:\xampp\htdocs\Vietnam Wikipedia Search Engine\solr-7.5.0\solr-7.5.0\server\solr\solrAnalyzer\conf\managed-schema: null
Ai biết về vấn đề này giúp đỡ t với,mọi câu trả lời đều rất quý giá
Cảm ơn


83% thành viên diễn đàn không hỏi bài tập, còn bạn thì sao?