Так что лучше всего «bottleneck.nanmean (dat, axis = 1)», «scipy.stats.nanmean (dat)» не быстрее, чем
могу рассчитать средние значения матрицы вдоль матрицы, но удалитьnan
значения из расчета? (Для R людей, думаю,na.rm = TRUE
).
Вот мой [не] рабочий пример:
import numpy as np
dat = np.array([[1, 2, 3],
[4, 5, np.nan],
[np.nan, 6, np.nan],
[np.nan, np.nan, np.nan]])
print(dat)
print(dat.mean(1)) # [ 2. nan nan nan]
Если удалить NaN, мой ожидаемый результат будет:
array([ 2., 4.5, 6., nan])