cudaMemset falla en la variable __device__

Tengo problemas para usarcudaMemset en una variable de dispositivo. ¿Es posible usar la referencia a la variable de dispositivo paracudaMemset, o es solo una cuestión de falta de indicadores del compilador, o bibliotecas ... Estoy usando cuda 4.1 y

NVRM versión: NVIDIA UNIX x86_64 Kernel Module 285.05.33 jue 19 de enero 14:07:02 PST 2012

Este es mi código de muestra:

#include <stdio.h>
#include <stdlib.h>
#include <cuda_runtime.h>

// device variable and kernel
__device__ float d_test;

int main() {

  if (cudaMemset(&d_test,0,sizeof(float)) !=cudaSuccess)
        printf("Error!\n");
}

que salidas:

Error!

Respuestas a la pregunta(4)

Su respuesta a la pregunta