CUDA: Como copiar um array 3D do host para o dispositivo?

Eu quero aprender como posso copiar uma matriz tridimensional da memória do host para a memória do dispositivo. Vamos dizer que eu tenho um array 3D que contém dados. Por exemplo int host_data [256] [256] [256]; Eu quero copiar esses dados para dev_data (uma matriz de dispositivo) de tal maneira tão host_data [x] [y] [z] = dev_data [x] [y] [z]; Como eu posso fazer isso? e como eu devo acessar o array dev_data no dispositivo? Um exemplo simples seria muito útil.

questionAnswers(2)

yourAnswerToTheQuestion