Java Stanford NLP: część etykiet mowy?
Stanford NLP, demotutaj, daje wyjście w następujący sposób:
Colorless/JJ green/JJ ideas/NNS sleep/VBP furiously/RB ./.
Co oznaczają znaczniki części mowy? Nie mogę znaleźć oficjalnej listy. Czy jest to własny system Stanforda, czy też używa uniwersalnych tagów? (Co jestJJ
, na przykład?)
Ponadto, gdy powtarzam zdania, szukając na przykład rzeczowników, robię coś, jak sprawdzanie, czy tag.contains('N')
. To wydaje się dość słabe. Czy jest lepszy sposób na programowe wyszukiwanie określonej części mowy?