Scikit-Learn сбалансированная субсэмплинг

Question

May 04, 2014, 01:31 PM

Scikit-Learn сбалансированная субсэмплинг

Я пытаюсь создать N сбалансированных случайных подвыборок из моего большого несбалансированного набора данных. Есть ли способ сделать это просто с помощью scikit-learn / pandas или я должен реализовать это сам? Любые указатели на код, который делает это?

Эти подвыборки должны быть случайными и могут накладываться друг на друга, поскольку я передаю каждый из них в отдельный классификатор в очень большом ансамбле классификаторов.

В Weka есть инструмент, который называется spreadsubsample, есть ли эквивалент в sklearn?http://wiki.pentaho.com/display/DATAMINING/SpreadSubsample

(Я знаю о взвешивании, но это не то, что я ищу.)

Scikit-Learn сбалансированная субсэмплинг

Ответы на вопрос(12)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Scikit-Learn сбалансированная субсэмплинг

Ответы на вопрос(12)

Ваш ответ на вопрос

Популярные вопросы