Python NLTK pos_tag не возвращает правильный тег части речи

Question

Jun 13, 2015, 06:52 PM

Имея это:

text = word_tokenize("The quick brown fox jumps over the lazy dog")

И работает:

nltk.pos_tag(text)

Я получил:

[('The', 'DT'), ('quick', 'NN'), ('brown', 'NN'), ('fox', 'NN'), ('jumps', 'NNS'), ('over', 'IN'), ('the', 'DT'), ('lazy', 'NN'), ('dog', 'NN')]

Это неверно Теги дляquick brown lazy в предложении должно быть:

('quick', 'JJ'), ('brown', 'JJ') , ('lazy', 'JJ')

Тестирование это через ихонлайн инструмент дает тот же результат;quick, brown а такжеfox должны быть прилагательными, а не существительными.

Ответы на вопрос(1)