Scikit-Learn Train_test_split с индексами
Как получить исходные индексы данных при использовании train_test_split ()?
Что у меня есть следующее
from sklearn.cross_validation import train_test_split
import numpy as np
data = np.reshape(np.randn(20),(10,2)) # 10 training examples
labels = np.random.randint(2, size=10) # 10 labels
x1, x2, y1, y2 = train_test_split(data, labels, size=0.2)
Но это не дает показателей исходных данных. Одним из обходных путей является добавление индексов к данным (например,data = [(i, d) for i, d in enumerate(data)]
), а затем передать их внутрьtrain_test_split
а затем снова разверните. Есть ли более чистые решения?