Элементное умное умножение матриц в BLAS?

Я начинаю использовать функции BLAS в C ++ (в частности, Intel MKL) для создания более быстрых версий моего старого кода Matlab.

До сих пор это работало хорошо, но я не могу понять, как выполнить поэлементное умножение на 2 матрицы (A. * B в Matlab).

Я знаю, что gemv делает нечто похожее между матрицей и вектором, поэтому я должен просто разбить одну из моих матриц на vectprs и повторно вызывать gemv? Я думаю, что это сработает, но я чувствую, что для этой операции должно быть что-то встроено.