Produto externo eficiente em python

O produto externo em python parece bastante lento quando temos que lidar com vetores de dimensão da ordem 10k. Alguém poderia me dar uma idéia de como eu poderia acelerar essa operação em python?

O código é o seguinte:

 In [8]: a.shape
 Out[8]: (128,)

 In [9]: b.shape
 Out[9]: (32000,)

 In [10]: %timeit np.outer(b,a)
 100 loops, best of 3: 15.4 ms per loop

Como tenho que fazer essa operação várias vezes, meu código está ficando mais lento.

questionAnswers(3)

yourAnswerToTheQuestion