Pandas: Amostrando um DataFrame [duplicado]
Esta pergunta já tem uma resposta aqui:
omo dividir dados em 3 conjuntos (treinamento, validação e teste 5 respostasEstou tentando ler um arquivo CSV razoavelmente grande com o Pandas e dividi-lo em dois blocos aleatórios, um dos quais 10% dos dados e o outro 90
Aqui está minha tentativa atual:
rows = data.index
row_count = len(rows)
random.shuffle(list(rows))
data.reindex(rows)
training_data = data[row_count // 10:]
testing_data = data[:row_count // 10]
Por algum motivo,sklearn
lança esse erro quando tento usar um desses objetos DataFrame resultantes dentro de um classificador SVM:
IndexError: each subindex must be either a slice, an integer, Ellipsis, or newaxis
Acho que estou fazendo errado. Existe uma maneira melhor de fazer isso