wie man benutzerdefinierte Stoppwörter mit Lucene in Java hinzufügt

Ich verwende Lucene, um englische Stoppwörter zu entfernen, aber meine Anforderung ist, englische Stoppwörter und benutzerdefinierte Stoppwörter zu entfernen. Unten ist mein Code zum Entfernen von englischen Stoppwörtern mit Lucene.

Mein Beispielcode:

public class Stopwords_remove {
    public String removeStopWords(String string) throws IOException 
    {
        StandardAnalyzer ana = new StandardAnalyzer(Version.LUCENE_30);
        TokenStream tokenStream = new StandardTokenizer(Version.LUCENE_36,newStringReader(string));
        StringBuilder sb = new StringBuilder();
        tokenStream = new StopFilter(Version.LUCENE_36, tokenStream, ana.STOP_WORDS_SET);
        CharTermAttribute token = tokenStream.getAttribute(CharTermAttribute.class);
        while (tokenStream.incrementToken()) 
        {
            if (sb.length() > 0) 
            {
                sb.append(" ");
            }
            sb.append(token.toString());
        }
        return sb.toString();
    }

    public static void main(String args[]) throws IOException
    {
          String text = "this is a java project written by james.";
          Stopwords_remove stopwords = new Stopwords_remove();
          stopwords.removeStopWords(text);

    }
}

Ausgabe:java project written james.

benötigte Leistung:java project james.

Wie kann ich das machen?

Antworten auf die Frage(1)

Ihre Antwort auf die Frage