Java Stanford NLP: Ein Teil der Sprachbezeichnungen?
Die Stanford NLP, DemoHier, gibt eine Ausgabe wie folgt aus:
Colorless/JJ green/JJ ideas/NNS sleep/VBP furiously/RB ./.
Was bedeuten die Part of Speech-Tags? Ich kann keine offizielle Liste finden. Ist es Stanfords eigenes System oder verwenden sie universelle Tags? (Was istJJ
, zum Beispiel?)
Auch wenn ich durch die Sätze iteriere und zum Beispiel nach Substantiven suche, überprüfe ich am Ende, ob das Tag vorhanden ist.contains('N')
. Das fühlt sich ziemlich schwach an. Gibt es eine bessere Möglichkeit, programmgesteuert nach einem bestimmten Teil der Sprache zu suchen?