CUDA_ERROR_INVALID_IMAGE durante cuModuleLoad

Eu criei um kernel muito simples (pode ser encontradoAqui) que eu compilar com sucesso usando

"C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v5.5\bin\nvcc.exe" --cl-version 2012 -ccbin "C:\Program Files (x86)\Microsoft Visual Studio 11.0\VC\bin" -I"C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v5.5\include" -cudart static -cubin temp.cu

e subseqüentemente use o seguinte código para carregar o kernel

CUresult err = cuInit(0);
CUdevice device;
err = cuDeviceGet(&device, 0);
CUcontext ctx;
err = cuCtxCreate(&ctx, 0, device);

CUmodule module;
string path = string(dir) + "\\temp.cubin";
err = cuModuleLoad(&module, path.c_str());

cuCtxDetach(ctx);

Infelizmente, durantecuModuleLoad Eu recebo um resultado deCUDA_ERROR_INVALID_IMAGE. Alguém pode me dizer por que isso pode estar acontecendo? O kernel é válido e compila sem problemas.

questionAnswers(2)

yourAnswerToTheQuestion