Как получить наиболее информативные функции для классификатора scikit-learn для разных классов?
Пакет NLTK предоставляет методshow_most_informative_features()
чтобы найти наиболее важные функции для обоих классов, с выводом, как:
contains(outstanding) = True pos : neg = 11.1 : 1.0
contains(seagal) = True neg : pos = 7.7 : 1.0
contains(wonderfully) = True pos : neg = 6.8 : 1.0
contains(damon) = True pos : neg = 5.9 : 1.0
contains(wasted) = True neg : pos = 5.8 : 1.0
Как ответили на этот вопросКак получить наиболее информативные функции для классификаторов scikit-learn? , это также может работать в scikit-Learn. Однако для двоичного классификатора ответ на этот вопрос выводит только саму лучшую функцию.
Итак, мой вопрос, как я могу определить связанный класс объекта, как в примере выше (выдающийся наиболее информативен в классе pos, а Сигал наиболее информативен в отрицательном классе)?
РЕДАКТИРОВАТЬ: на самом деле я хочу, чтобы список наиболее информативных слов для каждого класса. Как я могу это сделать? Спасибо!