Resultados da pesquisa a pedido "cuda"

1 a resposta

Falha na segmentação ao passar o ponteiro do dispositivo para cublasSnrm2

O código de cublas abaixo nos dá os erros: núcleo despejado enquanto estiver em "cublasSnrm2 (identificador, linha, dy, incy, de)", você poderia dar alguns conselhos? main.cu #include <iostream> #include "cublas.h" #include "cublas_v2.h" ...

2 a resposta

Classificando matrizes de estruturas no CUDA

Eu tenho um laptop com uma placa gráfica NVIDIA GT750M 4Gb (capacidade de computação 3.0). Eu preciso classificar uma matriz de estruturas em CUDA (cerca de 3 × 10 ^ 7 elementos). Mas não consigo descobrir como, pois não tenho experiência ...

2 a resposta

Como executar várias multiplicações de matriz no CUDA?

Eu tenho uma matriz de matrizes quadradasint *M[10]; de modo aM[i] localiza o primeiro elemento doi-ª matriz. Eu quero multiplicar todas as matrizesM[i] por outra matrizN, para que eu receba uma matriz de matrizes quadradasint *P[10] como ...

2 a resposta

Compreendendo as dimensões da grade CUDA, dimensões de bloco e organização de threads (explicação simples) [fechado]

Como os threads são organizados para serem executados por uma GPU?

1 a resposta

API matemática CUDA: diferença entre funções e intrínsecas

De acordo comAPDA de matemática CUDA [http://docs.nvidia.com/cuda/cuda-math-api/], muitas funções matemáticas, como seno e cosseno, são implementadas tanto em software (funções) quanto em hardware (intrínsecas). Esses intrínsecos provavelmente ...

1 a resposta

Exemplo de aumento do trabalho por thread no CUDA

Algoritmo : Estou escrevendo um programa com CUDA e o problema é o seguinte: Duas matrizes A (n * 128) e B (m * 128) Pego a primeira linha de A e calculo a distância entre esse vetor e todas as linhas de B, uma por uma. Eu escrevo o resultado ...

1 a resposta

Uma placa Compute Capability 3.0 pode executar o tempo de execução Tensorflow 1.8 tensorflow-gpu?

Percorrendo o tutorial de instalação do Linux (Tensorflow 1.8) e não sei como interpretar a frase: Placa GPU com CUDA Compute Capability 3.0 ou superior para construção a partir da fonte e 3.5 ou superior para nossos binários. Consulte a ...

2 a resposta

algoritmos de gráfico na GPU

os threads atuais da GPU são limitados de alguma forma (limite de memória, limite de estruturas de dados, sem recursão ...). você acha que seria viável implementar um problema de teoria dos grafos na GPU? por exemplo cobertura de vértice? ...

2 a resposta

Obtendo o CUDA Thrust para usar um fluxo CUDA de sua escolha

Observando os lançamentos do kernel dentro do código do CUDA Thrust, parece que eles sempre usam o fluxo padrão. Posso fazer o Thrust usar um fluxo de minha escolha? Estou faltando algo na API?

2 a resposta

GpuMat personalizado do kernel com float

Estou tentando escrever um kernel personalizado usandoGpuMat dados para encontrar o arco cosseno dos pixels de uma imagem. Posso carregar, fazer o download e alterar valores quando carregar dados quando a GPU tiverCV_8UC1 dados, mas caracteres ...