Программно добавлять имена столбцов в Numpy ndarray

Question

May 12, 2013, 11:44 PM

arrays multidimensional-array python numpy

Программно добавлять имена столбцов в Numpy ndarray

Я пытаюсь добавить имена столбцов в простой массив, а затем выбрать столбцы по их именам. Но это не работает. Я не могу сказать, возникает ли проблема, когда я добавляю имена или позже, когда пытаюсь их вызвать.

Вот мой код.

data = np.genfromtxt(csv_file, delimiter=',', dtype=np.float, skip_header=1)

#Add headers
csv_names = [ s.strip('"') for s in file(csv_file,'r').readline().strip().split(',')]
data = data.astype(np.dtype( [(n, 'float64') for n in csv_names] ))

Диагностика на основе измерений соответствует ожиданиям:

print len(csv_names)
>> 108
print data.shape
>> (1652, 108)

& quot; печать data.dtype.names & quot; также возвращает ожидаемый результат.

Но когда я начинаю называть столбцы по именам их полей, происходят странные вещи. & Quot; столбец & quot; все еще массив с 108 столбцами ...

print data["EDUC"].shape
>> (1652, 108)

... и, кажется, содержит больше пропущенных значений, чем строк в наборе данных.

print np.sum(np.isnan(data["EDUC"]))
>> 27976

Есть идеи, что здесь не так? Добавление заголовков должно быть тривиальной операцией, но я боролся с этой ошибкой в течение нескольких часов. Помогите!

Программно добавлять имена столбцов в Numpy ndarray

Ответы на вопрос(2)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Программно добавлять имена столбцов в Numpy ndarray

Ответы на вопрос(2)

Ваш ответ на вопрос

Популярные вопросы