Wie ngram Tokenizer in Lucene 4.0 haben?

Ich arbeite an der Indizierung großer Textdateien mit Text ohne Leerzeichen. Derzeit habe ich Ngram-Methode, um Zeichenfolge der Länge 12 zu generieren und dann indiziere ich sie. Gleiche Art zu suchen, bekomme ich die Zeichenfolge vom Benutzer generiert ngrams von 12 und verwenden Sie es dann bei der Erstellung der Abfrage. Lesen Sie beim Suchen etwas über den in Lucene enthaltenen Gramm-Tokenizer. Aber ich konnte nicht viele Beispiele finden.

Wie ngram Tokenizer in Lucene 4.0 implementieren?

Antworten auf die Frage(1)

Ihre Antwort auf die Frage