Pandas: Amostrando um DataFrame [duplicado]

Esta pergunta já tem uma resposta aqui:

omo dividir dados em 3 conjuntos (treinamento, validação e teste 5 respostas

Estou tentando ler um arquivo CSV razoavelmente grande com o Pandas e dividi-lo em dois blocos aleatórios, um dos quais 10% dos dados e o outro 90

Aqui está minha tentativa atual:

rows = data.index
row_count = len(rows)
random.shuffle(list(rows))

data.reindex(rows)

training_data = data[row_count // 10:]
testing_data = data[:row_count // 10]

Por algum motivo,sklearn lança esse erro quando tento usar um desses objetos DataFrame resultantes dentro de um classificador SVM:

IndexError: each subindex must be either a slice, an integer, Ellipsis, or newaxis

Acho que estou fazendo errado. Existe uma maneira melhor de fazer isso

questionAnswers(5)

yourAnswerToTheQuestion