¿Cómo obtener las funciones más informativas para los clasificadores de scikit-learn?

Question

Jun 20, 2012, 11:36 AM

classification scikit-learn machine-learning python

¿Cómo obtener las funciones más informativas para los clasificadores de scikit-learn?

Los clasificadores en paquetes de aprendizaje automático como liblinear y nltk ofrecen un método.show_most_informative_features(), que es realmente útil para depurar características:

viagra = None          ok : spam     =      4.5 : 1.0
hello = True           ok : spam     =      4.5 : 1.0
hello = None           spam : ok     =      3.3 : 1.0
viagra = True          spam : ok     =      3.3 : 1.0
casino = True          spam : ok     =      2.0 : 1.0
casino = None          ok : spam     =      1.5 : 1.0

Mi pregunta es si se implementa algo similar para los clasificadores en scikit-learn. Busqué en la documentación, pero no pude encontrar nada parecido.

Si todavía no existe tal función, ¿alguien sabe una solución para llegar a esos valores?

¡Muchas gracias!