Cómo calcular la suma de todas las columnas de una matriz numpy 2D (de manera eficiente)

Digamos que tengo la siguiente matriz numpy 2D que consta de cuatro filas y tres columnas:

>>> a = numpy.arange(12).reshape(4,3)
>>> print(a)
[[ 0  1  2]
 [ 3  4  5]
 [ 6  7  8]
 [ 9 10 11]]

¿Cuál sería una manera eficiente de generar una matriz 1D que contenga la suma de todas las columnas (como[18, 22, 26])? ¿Se puede hacer esto sin tener la necesidad de recorrer todas las columnas?