Python NLTK pos_tag no devuelve la etiqueta correcta de parte del discurso
Teniendo esto:
text = word_tokenize("The quick brown fox jumps over the lazy dog")
Y corriendo:
nltk.pos_tag(text)
Yo obtengo:
[('The', 'DT'), ('quick', 'NN'), ('brown', 'NN'), ('fox', 'NN'), ('jumps', 'NNS'), ('over', 'IN'), ('the', 'DT'), ('lazy', 'NN'), ('dog', 'NN')]
Esto es incorrecto. Las etiquetas paraquick brown lazy
en la oración debe ser:
('quick', 'JJ'), ('brown', 'JJ') , ('lazy', 'JJ')
Probar esto a través de suherramienta en línea da el mismo resultado;quick
, brown
yfox
deben ser adjetivos, no sustantivos.