Scikit-learn train_test_split mit Indizes

Wie erhalte ich die ursprünglichen Indizes der Daten, wenn ich train_test_split () verwende?

Was ich habe, ist das folgende

from sklearn.cross_validation import train_test_split
import numpy as np
data = np.reshape(np.randn(20),(10,2)) # 10 training examples
labels = np.random.randint(2, size=10) # 10 labels
x1, x2, y1, y2 = train_test_split(data, labels, size=0.2)

Aber dies gibt nicht die Indizes der ursprünglichen Daten. Eine Problemumgehung besteht darin, die Indizes zu Daten hinzuzufügen (z. B.data = [(i, d) for i, d in enumerate(data)]) und dann in @ übergebtrain_test_split und dann wieder erweitern. Gibt es sauberere Lösungen?

Antworten auf die Frage(8)

Ihre Antwort auf die Frage