Java Stanford PNL: Parte dos rótulos de fala?
A PNL de Stanford, demo'dAqui, dá uma saída como esta:
Colorless/JJ green/JJ ideas/NNS sleep/VBP furiously/RB ./.
O que as tags da parte da fala significam? Não consigo encontrar uma lista oficial. É o próprio sistema de Stanford, ou eles estão usando tags universais? (O que éJJ
, por exemplo?)
Além disso, quando estou interagindo com as sentenças, procurando substantivos, por exemplo, acabo fazendo algo como verificar se a tag.contains('N')
. Isso parece muito fraco. Existe uma maneira melhor de pesquisar programaticamente uma certa parte da fala?