Solr: synonimy wielu słów

Opracowuję zestaw synonimów, w którym można znaleźć wyrażenia wielowyrazowe, takie jak:

czarna jagoda => jeżyna

Na etapie analizy i za pomocą narzędzi /admin/analysis.jsp widzę, że wyniki są poprawne.

Zapytanie takie jak „quiero una black berry” zwraca następującą sekwencję:

Org.apache.solr.analysis.StandardTokenizerFactory {luceneMatchVersion = LUCENE_36}:

position    1   2   3   4
term text   quiero  una black   berry
startOffset 0   7   11  17
endOffset   6   10  16  22
type    <ALPHANUM>  <ALPHANUM>  <ALPHANUM>  <ALPHANUM>

Org.apache.solr.analysis.SynonymFilterFactory {synonimy = język / synonimy_es.txt, expand = false, ignoreCase = true, luceneMatchVersion = LUCENE_36}:

position    1   2   3
term text   quiero  una blackberry
type    <ALPHANUM>  <ALPHANUM>  SYNONYM
startOffset 0   7   11
endOffset   6   10  22

Jeśli jednak spróbuję tego zdania w „prawdziwym” zapytaniu, procedurze obsługi żądań (ewolucja programu obsługi edismax), tokeny „czarny” i „jagoda” nie zostaną zastąpione przez „blackberry”.

widziałemtutaj że możesz rozwiązać tę sytuację, modyfikując wtyczkę FieldQParser.

W każdym razie, ponieważ taki post powstał prawie 3 lata temu, chciałbym wiedzieć, czy jest jakiś sposób na rozwiązanie tego problemu w Solr, unikając konieczności rozwijania jakiejś wtyczki.

Dzięki.

questionAnswers(2)

yourAnswerToTheQuestion