Como calcular a soma de todas as colunas de um array numpy 2D (eficientemente)

Digamos que eu tenha o seguinte array numpy 2D que consiste em quatro linhas e três colunas:

>>> a = numpy.arange(12).reshape(4,3)
>>> print(a)
[[ 0  1  2]
 [ 3  4  5]
 [ 6  7  8]
 [ 9 10 11]]

Qual seria uma maneira eficiente de gerar uma matriz 1D que contenha a soma de todas as colunas (como[18, 22, 26]) Isso pode ser feito sem ter a necessidade de percorrer todas as colunas?

questionAnswers(6)

yourAnswerToTheQuestion