Solr: synonimy wielu słów
Opracowuję zestaw synonimów, w którym można znaleźć wyrażenia wielowyrazowe, takie jak:
czarna jagoda => jeżyna
Na etapie analizy i za pomocą narzędzi /admin/analysis.jsp widzę, że wyniki są poprawne.
Zapytanie takie jak „quiero una black berry” zwraca następującą sekwencję:
Org.apache.solr.analysis.StandardTokenizerFactory {luceneMatchVersion = LUCENE_36}:
position 1 2 3 4
term text quiero una black berry
startOffset 0 7 11 17
endOffset 6 10 16 22
type <ALPHANUM> <ALPHANUM> <ALPHANUM> <ALPHANUM>
Org.apache.solr.analysis.SynonymFilterFactory {synonimy = język / synonimy_es.txt, expand = false, ignoreCase = true, luceneMatchVersion = LUCENE_36}:
position 1 2 3
term text quiero una blackberry
type <ALPHANUM> <ALPHANUM> SYNONYM
startOffset 0 7 11
endOffset 6 10 22
Jeśli jednak spróbuję tego zdania w „prawdziwym” zapytaniu, procedurze obsługi żądań (ewolucja programu obsługi edismax), tokeny „czarny” i „jagoda” nie zostaną zastąpione przez „blackberry”.
widziałemtutaj że możesz rozwiązać tę sytuację, modyfikując wtyczkę FieldQParser.
W każdym razie, ponieważ taki post powstał prawie 3 lata temu, chciałbym wiedzieć, czy jest jakiś sposób na rozwiązanie tego problemu w Solr, unikając konieczności rozwijania jakiejś wtyczki.
Dzięki.