Effiziente Teilstringsuche in einer großen Textdatei mit 100 Millionen Zeichenfolgen (keine doppelte Zeichenfolge)

Question

Jan 31, 2013, 08:09 PM

Effiziente Teilstringsuche in einer großen Textdatei mit 100 Millionen Zeichenfolgen (keine doppelte Zeichenfolge)

Ich habe eine große Textdatei (1,5 GB) mit 100 Millionen Zeichenfolgen (keine doppelte Zeichenfolge) und alle Zeichenfolgen sind zeilenweise in der Datei angeordnet. Ich möchte eine Wepapplication in Java machen, damit der Benutzer, wenn er ein Schlüsselwort (Substring) angibt, die Anzahl aller in der Datei, die dieses Schlüsselwort enthält, vorhandenen Zeichenfolgen erhält. Ich kenne bereits eine Technik von LUCENE. Gibt es eine andere Möglichkeit, dies zu tun? Ich möchte das Ergebnis innerhalb von 3-4 Sekunden. MEIN SYSTEM HAT 4GB RAM UND DUAL CORE Konfiguration .... muss in "JAVA ONLY" gemacht werden