Пользователь должен сначала:
5 ПитонаНЛТК книга дает этот пример пометки слов в предложении:
>>> text = nltk.word_tokenize("And now for something completely different")
>>> nltk.pos_tag(text)
[('And', 'CC'), ('now', 'RB'), ('for', 'IN'), ('something', 'NN'), ('completely', 'RB'), ('different', 'JJ')]
nltk.pos_tag вызывает тег по умолчанию, который использует полный набор тегов. Позже в главеупрощенный набор тегов вводится.
Как я могу пометить предложения с помощью этого упрощенного набора тегов части речи?
Также правильно ли я понял тегер, т. Е. Могу ли я изменить набор тегов, который использует теггер, когда я спрашиваю, или я должен сопоставить возвращаемые теги с упрощенным набором, или я должен создать новый теггер из нового, просто помеченный корпус?