Compilando código contendo paralelismo dinâmico falha

Eu estou fazendo programação de paralelismo dinâmico usando CUDA 5.5 e uma NVIDIA GeForce GTX 780 cuja capacidade de computação é 3.5. Eu estou chamando uma função kernel dentro de uma função do kernel, mas está me dando um erro:

erro: chamar uma função __global__ ("kernel_6") de uma função __global__ ("kernel_5") é permitido somente na arquitetura compute_35 ou acima

O que estou fazendo de errado?

questionAnswers(3)

yourAnswerToTheQuestion