Włączanie soundex / metafone dla znaków innych niż angielskie
W ciągu ostatnich kilku dni studiowałem soundex, metafon i inne techniki przeszukiwania ciągów, a moim zdaniem oba algorytmy sprawdzają się w obsłudze nieanglojęzycznych słów transliterowanych na angielski.
Jednak wymaganie, które powinienem spełnić, polega na tym, by takie wyszukiwanie działało w oryginalnych, nieprzetłumaczonych językach, akceptujących alfabety, takie jak niemiecki, norweski, a nawet alfabet alfabetyczny.
Czy są jakieś algorytmy wyszukiwania zdolne całkowicie obsłużyć te alfabety? A może lepiej korzystać z bibliotek pełnotekstowych innych firm, takich jak Lucene? W związku z tym pojawia się pytanie „czy Lucene obsługuje alfabety inne niż angielski?”