Java Stanford NLP: parte de las etiquetas de voz?
The Stanford NLP, demo'daquí, da una salida como esta:
Colorless/JJ green/JJ ideas/NNS sleep/VBP furiously/RB ./.
¿Qué significan las etiquetas de la parte del discurso? No puedo encontrar una lista oficial. ¿Es el propio sistema de Stanford o están utilizando etiquetas universales? (Que esJJ
, ¿por ejemplo?)
Además, cuando estoy iterando a través de las oraciones, buscando sustantivos, por ejemplo, termino haciendo algo como revisar para ver si la etiqueta.contains('N')
. Esto se siente bastante débil. ¿Hay una mejor manera de buscar programáticamente una determinada parte del habla?