Atingindo a multiplicação da matriz de lotes usando tensordot

Estou tentando atingir o mesmo comportamento que a multiplicação de matriz paralela np.matmul usando apenas tensordot, ponto e remodelagem etc.

A biblioteca que estou traduzindo para o uso não possui um matmul que suporte multiplicação paralela, apenas pontos e tensordot.

Além disso, quero evitar a iteração sobre a primeira dimensão, e quero fazer isso usando um conjunto de multiplicações e remodelagem de matriz (quero que ele seja executado usando BLAS / GPU, pois tenho um grande número de matrizes pequenas para calcular em paralelo).

Aqui está um exemplo:

import numpy as np

angles = np.array([np.pi/4, 2*np.pi/4, 2*np.pi/4])

vectors = np.array([ [1,0],[1,-1],[-1,0]])

s = np.sin(angles)
c = np.cos(angles)

rotations = np.array([[c,s],[-s,c]]).T

print rotations

print vectors

print("Correct: %s" % np.matmul(rotations, vectors.reshape(3,2,1)))

# I want to do this using tensordot/reshaping, i.e just gemm BLAS operations underneath
print("Wrong: %s" % np.tensordot(rotations, vectors, axes=(1,1)))

A saída disso é:

Correct: [[[  7.07106781e-01]
  [  7.07106781e-01]]

 [[  1.00000000e+00]
  [  1.00000000e+00]]

 [[ -6.12323400e-17]
  [ -1.00000000e+00]]]


Wrong: [[[  7.07106781e-01   1.11022302e-16  -7.07106781e-01]
  [ -7.07106781e-01  -1.41421356e+00   7.07106781e-01]]

 [[  6.12323400e-17  -1.00000000e+00  -6.12323400e-17]
  [ -1.00000000e+00  -1.00000000e+00   1.00000000e+00]]

 [[  6.12323400e-17  -1.00000000e+00  -6.12323400e-17]
  [ -1.00000000e+00  -1.00000000e+00   1.00000000e+00]]]

Existe uma maneira em que eu possa modificar a segunda expressão para obter o mesmo resultado que a primeira, apenas usando dot / tensordot.

Eu acredito que é possível, e já vialguns comentários online, mas nunca exemplos

questionAnswers(1)

yourAnswerToTheQuestion