Scikit-learn, GroupKFold com grupos aleatórios?

Question

Nov 26, 2016, 03:52 PM

shuffle scikit-learn python cross-validation

Scikit-learn, GroupKFold com grupos aleatórios?

Eu estava usando o StratifiedKFold no scikit-learn, mas agora preciso prestar atenção também aos "grupos". Há uma boa função GroupKFold, mas meus dados dependem muito do tempo. Tão semelhante como na ajuda, ou seja, número de semanas é o índice de agrupamento. Mas cada semana deve ser apenas uma dobra.

Suponha que eu precise de 10 dobras. O que preciso é embaralhar os dados primeiro, antes de poder usar o GroupKFold.

A reprodução aleatória está no sentido do grupo - portanto, grupos inteiros devem ser misturados entre si.

Existe uma maneira de fazer isso com o scikit-learn elegante de alguma forma? Parece-me que o GroupKFold é robusto para embaralhar os dados primeiro.

Se não há como fazer isso com o scikit, alguém pode escrever um código eficaz disso? Eu tenho grandes conjuntos de dados.

matriz, etiqueta, grupos como entradas

questionAnswers(1)

Perguntas populares

0 a resposta

Como inserir uma nova linha na frente de um padrão?

0 a resposta

Xcode 4 git integração

0 a resposta

VBA - Como obter o último arquivo ou pasta modificado em um diretório no Excel 2010

0 a resposta

Por que recebo o erro "Não é possível armazenar chaves não privadas" ao criar um soquete SSL em Java?

0 a resposta

comando bash do Ubuntu RVM Rails não foi encontrado

Você é muito ativo! É ótimo!

Scikit-learn, GroupKFold com grupos aleatórios?

questionAnswers(1)

yourAnswerToTheQuestion

Perguntas populares