Фрагмент кода Python NLTK для обучения классификатора (наивных байесов), используя частоту признаков
Мне было интересно, может ли кто-нибудь помочь мне через фрагмент кода, который демонстрирует, как обучить наивного байесовского классификатора, используя метод частотных характеристик, а не наличие функций.
Я предполагаю, что ниже, как показано в главе 6текст ссылки относится к созданию набора функций с использованием Feature Presence (FP) -
def document_features(document):
document_words = set(document)
features = {}
for word in word_features:
features['contains(%s)' % word] = (word in document_words)
return features
Пожалуйста посоветуй