Zusätzliche Informationen (Aktiv / Passiv, Zeitformen ...) von einem Tagger erhalten
Ich benutze den Stanford Tagger zur Bestimmung der Wortarten. Ich möchte jedoch mehr Informationen aus dem Text herausholen. Gibt es eine Möglichkeit, weitere Informationen zu erhalten, wie die Zeitform des Satzes oder ob er aktiv / passiv ist?
Bisher verwende ich den sehr einfachen PoS-Tagging-Ansatz:
List<List<TaggedWord>> taggedUnits = new ArrayList<List<TaggedWord>>();
String input = "This sentence is going to be future. The door was opened.";
for (List<HasWord> sentence : MaxentTagger.tokenizeText(new StringReader(input)))
{
taggedUnits.add(tagger.tagSentence(sentence));
}