Scikit-Learn, GroupKFold с тасованием групп?
Я использовал StratifiedKFold из scikit-learn, но теперь мне нужно следить и за «группами». Есть хорошая функция GroupKFold, но мои данные очень зависят от времени. Так же, как в справке, то есть номер недели является индексом группировки. Но каждая неделя должна быть только в один раз.
Предположим, мне нужно 10 сгибов. Мне нужно перетасовать данные, прежде чем я смогу использовать GroupKFold.
Тасование происходит в групповом смысле, поэтому целые группы должны перемешиваться друг с другом.
Есть ли способ сделать это с Scikit-Learn элегантный как-то? Мне кажется, GroupKFold надежен для перетасовки данных в первую очередь.
Если нет возможности сделать это с помощью Scikit, может кто-нибудь написать эффективный код этого? У меня большие наборы данных.
матрица, метка, группы в качестве входных данных