Símbolo de dispositivo inválido ao copiar para a memória constante CUDA
Eu tenho vários arquivos para um aplicativo no processamento de imagens. Como o número de linhas e colunas para uma imagem não muda ao fazer algum algoritmo de processamento de imagem, eu estava tentando colocar esses valores em memória constante. Meu aplicativo parece:
Imageproc.cuh
...
...
__constant__ int c_rows;
__constant__ int c_cols;
#ifdef __cplusplus
extern "C"
{
#endif
...
...
#ifdef __cplusplus
}
#endif
Imageproc.cu
...
...
int algorithm(float *a, const int rows, const int cols){
...
...
checkCudaError(cudaMemcpyToSymbol(&c_rows, &rows, sizeof(int)));
checkCudaError(cudaMemcpyToSymbol(&c_cols, &cols, sizeof(int)));
dim3 block(T, T);
dim3 grid(cols/T+1, rows/T+1);
kernel<<<grid, block>>>( ... );
...
...
}
Ele compila bem, mas ao tentar executar o programa eu receboinvalid device symbol cudaMemcpyToSymbol(&c_rows, &rows, sizeof(int))
Não posso colocar essas variáveis em memória constante ou o que estou perdendo?