Java Stanford NLP: część etykiet mowy?

Question

Dec 02, 2009, 03:30 PM

Java Stanford NLP: część etykiet mowy?

Stanford NLP, demotutaj, daje wyjście w następujący sposób:

Colorless/JJ green/JJ ideas/NNS sleep/VBP furiously/RB ./.

Co oznaczają znaczniki części mowy? Nie mogę znaleźć oficjalnej listy. Czy jest to własny system Stanforda, czy też używa uniwersalnych tagów? (Co jestJJ, na przykład?)

Ponadto, gdy powtarzam zdania, szukając na przykład rzeczowników, robię coś, jak sprawdzanie, czy tag.contains('N'). To wydaje się dość słabe. Czy jest lepszy sposób na programowe wyszukiwanie określonej części mowy?