¿Cómo obtener las funciones más informativas para los clasificadores de scikit-learn?
Los clasificadores en paquetes de aprendizaje automático como liblinear y nltk ofrecen un método.show_most_informative_features()
, que es realmente útil para depurar características:
viagra = None ok : spam = 4.5 : 1.0
hello = True ok : spam = 4.5 : 1.0
hello = None spam : ok = 3.3 : 1.0
viagra = True spam : ok = 3.3 : 1.0
casino = True spam : ok = 2.0 : 1.0
casino = None ok : spam = 1.5 : 1.0
Mi pregunta es si se implementa algo similar para los clasificadores en scikit-learn. Busqué en la documentación, pero no pude encontrar nada parecido.
Si todavía no existe tal función, ¿alguien sabe una solución para llegar a esos valores?
¡Muchas gracias!