Scikit-learn, GroupKFold com grupos aleatórios?
Eu estava usando o StratifiedKFold no scikit-learn, mas agora preciso prestar atenção também aos "grupos". Há uma boa função GroupKFold, mas meus dados dependem muito do tempo. Tão semelhante como na ajuda, ou seja, número de semanas é o índice de agrupamento. Mas cada semana deve ser apenas uma dobra.
Suponha que eu precise de 10 dobras. O que preciso é embaralhar os dados primeiro, antes de poder usar o GroupKFold.
A reprodução aleatória está no sentido do grupo - portanto, grupos inteiros devem ser misturados entre si.
Existe uma maneira de fazer isso com o scikit-learn elegante de alguma forma? Parece-me que o GroupKFold é robusto para embaralhar os dados primeiro.
Se não há como fazer isso com o scikit, alguém pode escrever um código eficaz disso? Eu tenho grandes conjuntos de dados.
matriz, etiqueta, grupos como entradas