limite padrão do scikit .predict ()
Estou trabalhando em um problema de classificação com classes desequilibradas (5% 1s). Eu quero prever a classe, não a probabilidade.
Em um problema de classificação binária, é o scikitclassifier.predict()
usando0.5
por padrão? Caso contrário, qual é o método padrão? Se sim, como faço para mudar?
No scikit, alguns classificadores têm oclass_weight='auto'
opção, mas nem todos fazem. Comclass_weight='auto'
, seria.predict()
usar a proporção real da população como um limite?
Qual seria a maneira de fazer isso em um classificador comoMultinomialNB
isso não suportaclass_weight
? Além de usarpredict_proba()
e depois calculo as aulas pessoalmente.