Выделить 2D массив в памяти устройства в CUDA

Как выделить и передать (на хост и из хоста) 2D-массивы в памяти устройства в Cuda?

Ответы на вопрос(3)

льше.

__global__ void kernel(float* devPtr, int pitch)
{
    int r = threadIdx.x;

    float* row = (float*)((char*)devPtr + r * pitch);
    for (int c = 0; c < width; ++c) {
         float element = row[c];
    }
}

Затем вы вычисляете распределение блоков и потоков так, чтобы каждый поток имел дело с одним элементом.

 darda19 июн. 2014 г., 02:25
Код, размещенный Gitmo, является бесполезным образцом из документации. Да, ваша версия быстрее, но как вы делаете это параллельно для строк и столбцов? Строго говоря, в ваших руках может быть беспорядок, потому что вы не проверяете, еслиr меньше фактического количества строк
Решение Вопроса

ВстроенныйcudaMallocPitch()ункция @ сделала свою работу. И я мог бы передать массив и с устройства, используяcudaMemcpy2D() функция.

Наприме

cudaMallocPitch((void**) &array, &pitch, a*sizeof(float), b);

Это создает двумерный массив размером a * b с шагом, передаваемым в качестве параметра.

Следующий код создает двумерный массив и циклически повторяет элементы. Он легко компилируется, вы можете использовать его.

#include<stdio.h>
#include<cuda.h>
#define height 50
#define width 50

// Device code
__global__ void kernel(float* devPtr, int pitch)
{
    for (int r = 0; r < height; ++r) {
        float* row = (float*)((char*)devPtr + r * pitch);
        for (int c = 0; c < width; ++c) {
             float element = row[c];
        }
    }
}

//Host Code
int main()
{

float* devPtr;
size_t pitch;
cudaMallocPitch((void**)&devPtr, &pitch, width * sizeof(float), height);
kernel<<<100, 512>>>(devPtr, pitch);
return 0;
}
 scatman12 апр. 2011 г., 08:08
Можно ли выделить новую строку для массива позже?

Ваш ответ на вопрос