Como obter recursos mais informativos para os classificadores scikit-learn?

Question

Jun 20, 2012, 11:36 AM

python machine-learning classification scikit-learn

Como obter recursos mais informativos para os classificadores scikit-learn?

Os classificadores em pacotes de aprendizado de máquina como liblinear e nltk oferecem um métodoshow_most_informative_features(), o que é realmente útil para recursos de depuração:

viagra = None          ok : spam     =      4.5 : 1.0
hello = True           ok : spam     =      4.5 : 1.0
hello = None           spam : ok     =      3.3 : 1.0
viagra = True          spam : ok     =      3.3 : 1.0
casino = True          spam : ok     =      2.0 : 1.0
casino = None          ok : spam     =      1.5 : 1.0

Minha pergunta é se algo semelhante é implementado para os classificadores em scikit-learn. Eu procurei a documentação, mas não consegui encontrar nada parecido.

Se ainda não existe essa função, alguém conhece uma solução alternativa para chegar a esses valores?

Muito obrigado!