Atingindo a multiplicação da matriz de lotes usando tensordot
Estou tentando atingir o mesmo comportamento que a multiplicação de matriz paralela np.matmul usando apenas tensordot, ponto e remodelagem etc.
A biblioteca que estou traduzindo para o uso não possui um matmul que suporte multiplicação paralela, apenas pontos e tensordot.
Além disso, quero evitar a iteração sobre a primeira dimensão, e quero fazer isso usando um conjunto de multiplicações e remodelagem de matriz (quero que ele seja executado usando BLAS / GPU, pois tenho um grande número de matrizes pequenas para calcular em paralelo).
Aqui está um exemplo:
import numpy as np
angles = np.array([np.pi/4, 2*np.pi/4, 2*np.pi/4])
vectors = np.array([ [1,0],[1,-1],[-1,0]])
s = np.sin(angles)
c = np.cos(angles)
rotations = np.array([[c,s],[-s,c]]).T
print rotations
print vectors
print("Correct: %s" % np.matmul(rotations, vectors.reshape(3,2,1)))
# I want to do this using tensordot/reshaping, i.e just gemm BLAS operations underneath
print("Wrong: %s" % np.tensordot(rotations, vectors, axes=(1,1)))
A saída disso é:
Correct: [[[ 7.07106781e-01]
[ 7.07106781e-01]]
[[ 1.00000000e+00]
[ 1.00000000e+00]]
[[ -6.12323400e-17]
[ -1.00000000e+00]]]
Wrong: [[[ 7.07106781e-01 1.11022302e-16 -7.07106781e-01]
[ -7.07106781e-01 -1.41421356e+00 7.07106781e-01]]
[[ 6.12323400e-17 -1.00000000e+00 -6.12323400e-17]
[ -1.00000000e+00 -1.00000000e+00 1.00000000e+00]]
[[ 6.12323400e-17 -1.00000000e+00 -6.12323400e-17]
[ -1.00000000e+00 -1.00000000e+00 1.00000000e+00]]]
Existe uma maneira em que eu possa modificar a segunda expressão para obter o mesmo resultado que a primeira, apenas usando dot / tensordot.
Eu acredito que é possível, e já vialguns comentários online, mas nunca exemplos