Como obter recursos mais informativos para os classificadores scikit-learn?
Os classificadores em pacotes de aprendizado de máquina como liblinear e nltk oferecem um métodoshow_most_informative_features()
, o que é realmente útil para recursos de depuração:
viagra = None ok : spam = 4.5 : 1.0
hello = True ok : spam = 4.5 : 1.0
hello = None spam : ok = 3.3 : 1.0
viagra = True spam : ok = 3.3 : 1.0
casino = True spam : ok = 2.0 : 1.0
casino = None ok : spam = 1.5 : 1.0
Minha pergunta é se algo semelhante é implementado para os classificadores em scikit-learn. Eu procurei a documentação, mas não consegui encontrar nada parecido.
Se ainda não existe essa função, alguém conhece uma solução alternativa para chegar a esses valores?
Muito obrigado!