ValueError: Array ist zu groß - kann nicht verstehen, wie dies behoben werden kann
Ich führe folgenden Code aus:
traindata = trainData.read_csv('train.tsv', delimiter = '\t')
welches diese Funktion aufruft:
def read_csv(self, filename, delimiter = ',', quotechar = '"'):
# open the file
reader = csv.reader(open(filename, 'rb'), delimiter = delimiter, quotechar = quotechar)
# read first line and extract its data
self.column_headings = np.array(next(reader))
# read subsequent lines
rows = []
for row in reader:
rows.append(row)
self.data = np.array(rows)
self.m, self.n = self.data.shape
Dies würde mir dann erlauben anzurufen
m, n = traindata.data.shape
print m, n, traindata.column_headings
Leider in meinem Anruf bei derread_csv
Funktion bekomme ich den Fehler:
---------------------------------------------------------------------------
ValueError Traceback (most recent call last)
<ipython-input-74-1cc5776f9a9c> in <module>()
13 print "loading data.."
14
---> 15 traindata = trainData.read_csv('test.tsv', delimiter = '\t')
16
C:\pc in read_csv(self, filename, delimiter, quotechar)
17 for row in reader:
18 rows.append(row)
---> 19 self.data = np.array(rows)
20 self.m, self.n = self.data.shape
21
ValueError: array is too big.
Wie kann ich dieses Verhalten beheben und zulassen, dass der Code ausgeführt wird?
Bearbeiten: Die Daten sind eine .tsv-Datei,hier entpacken.