Pandas: выборка DataFrame [дубликата]

Question

Aug 30, 2012, 08:12 AM

Pandas: выборка DataFrame [дубликата]

На этот вопрос уже есть ответ:

Как разделить данные на 3 набора (обучение, проверка и тестирование)? 5 ответов

Я пытаюсь прочитать довольно большой файл CSV с помощью Pandas и разделить его на две случайные части, одна из которых составляет 10% данных, а другая - 90%.

Вот моя нынешняя попытка:

rows = data.index
row_count = len(rows)
random.shuffle(list(rows))

data.reindex(rows)

training_data = data[row_count // 10:]
testing_data = data[:row_count // 10]

По какой-то причине,sklearn выдает эту ошибку, когда я пытаюсь использовать один из этих результирующих объектов DataFrame внутри классификатора SVM:

IndexError: each subindex must be either a slice, an integer, Ellipsis, or newaxis

Я думаю, что делаю это неправильно. Есть лучший способ сделать это

Pandas: выборка DataFrame [дубликата]

Ответы на вопрос(5)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Pandas: выборка DataFrame [дубликата]

Ответы на вопрос(5)

Ваш ответ на вопрос

Популярные вопросы