numpy.sum puede ser más lento que Python for-loop

Al sumar una matriz sobre un eje específico, el método de matriz dedicadoarray.sum(ax) en realidad puede ser más lento que un bucle for:

v = np.random.rand(3,1e4)

timeit v.sum(0)                             # vectorized method
1000 loops, best of 3: 183 us per loop

timeit for row in v[1:]: v[0] += row        # python loop
10000 loops, best of 3: 39.3 us per loop

¡El método vectorizado es más de 4 veces más lento que un bucle for común! ¿Qué está pasando (wr) en (g) aquí, no puedo confiar en que los métodos vectorizados en número son más rápidos que los bucles for?

Respuestas a la pregunta(1)

Su respuesta a la pregunta