Solr 4.4: StopFilterFactory i enablePositionIncrements

Question

Sep 07, 2013, 02:13 AM

Solr 4.4: StopFilterFactory i enablePositionIncrements

Podczas próby uaktualnienia z Solr 4.3.0 do Solr 4.4.0 natknąłem się na ten wyjątek:

 java.lang.IllegalArgumentException: enablePositionIncrements=false is not supported anymore as of Lucene 4.4 as it can create broken token streams

co doprowadziło mnie doten przypadek. Muszę być w stanie dopasować zapytania niezależnie od interweniujących stopwords (które działały z enablePositionIncrements = "true"). Na przykład: „foo of the bar” znajdzie dokumenty pasujące do „foo bar”, „foo of bar” i „foo of the bar”. Z tą opcją przestarzałe w 4.4.0 Nie wiem, jak utrzymać tę samą funkcjonalność.

Thepakiet javadoc dodaje:

Jeśli wybrany analizator filtruje słowa stop „is” i „the”, to w przypadku dokumentu zawierającego ciąg „blue is the sky” tylko indeksy „blue”, „sky” są indeksowane, z pozycją („sky”) = 3 + pozycja („niebieski”). Teraz zapytanie do frazy „niebieski to niebo” znajdzie ten dokument, ponieważ ten sam analizator filtruje te same słowa stop z tego zapytania. Jednak zapytanie frazowe „błękitne niebo” nie znalazłoby tego dokumentu, ponieważ przyrost pozycji między „niebieskim” i „niebem” to tylko 1.

Jeśli to zachowanie nie pasuje do potrzeb aplikacji, analizator składni zapytań musi być skonfigurowany tak, aby nie uwzględniał przyrostów pozycji podczas generowania zapytań o wyrażenie.

Ale nie ma wzmianki o tym, jak właściwie skonfigurować parser zapytań, aby to zrobić. Czy ktoś wie, jak poradzić sobie z tym problemem, gdy Solr porusza się w kierunku 5.0?