Resultados da pesquisa a pedido "cuda"
Falha na segmentação ao passar o ponteiro do dispositivo para cublasSnrm2
O código de cublas abaixo nos dá os erros: núcleo despejado enquanto estiver em "cublasSnrm2 (identificador, linha, dy, incy, de)", você poderia dar alguns conselhos? main.cu #include <iostream> #include "cublas.h" #include "cublas_v2.h" ...
Classificando matrizes de estruturas no CUDA
Eu tenho um laptop com uma placa gráfica NVIDIA GT750M 4Gb (capacidade de computação 3.0). Eu preciso classificar uma matriz de estruturas em CUDA (cerca de 3 × 10 ^ 7 elementos). Mas não consigo descobrir como, pois não tenho experiência ...
Como executar várias multiplicações de matriz no CUDA?
Eu tenho uma matriz de matrizes quadradasint *M[10]; de modo aM[i] localiza o primeiro elemento doi-ª matriz. Eu quero multiplicar todas as matrizesM[i] por outra matrizN, para que eu receba uma matriz de matrizes quadradasint *P[10] como ...
Compreendendo as dimensões da grade CUDA, dimensões de bloco e organização de threads (explicação simples) [fechado]
Como os threads são organizados para serem executados por uma GPU?
API matemática CUDA: diferença entre funções e intrínsecas
De acordo comAPDA de matemática CUDA [http://docs.nvidia.com/cuda/cuda-math-api/], muitas funções matemáticas, como seno e cosseno, são implementadas tanto em software (funções) quanto em hardware (intrínsecas). Esses intrínsecos provavelmente ...
Exemplo de aumento do trabalho por thread no CUDA
Algoritmo : Estou escrevendo um programa com CUDA e o problema é o seguinte: Duas matrizes A (n * 128) e B (m * 128) Pego a primeira linha de A e calculo a distância entre esse vetor e todas as linhas de B, uma por uma. Eu escrevo o resultado ...
Uma placa Compute Capability 3.0 pode executar o tempo de execução Tensorflow 1.8 tensorflow-gpu?
Percorrendo o tutorial de instalação do Linux (Tensorflow 1.8) e não sei como interpretar a frase: Placa GPU com CUDA Compute Capability 3.0 ou superior para construção a partir da fonte e 3.5 ou superior para nossos binários. Consulte a ...
algoritmos de gráfico na GPU
os threads atuais da GPU são limitados de alguma forma (limite de memória, limite de estruturas de dados, sem recursão ...). você acha que seria viável implementar um problema de teoria dos grafos na GPU? por exemplo cobertura de vértice? ...
Obtendo o CUDA Thrust para usar um fluxo CUDA de sua escolha
Observando os lançamentos do kernel dentro do código do CUDA Thrust, parece que eles sempre usam o fluxo padrão. Posso fazer o Thrust usar um fluxo de minha escolha? Estou faltando algo na API?
GpuMat personalizado do kernel com float
Estou tentando escrever um kernel personalizado usandoGpuMat dados para encontrar o arco cosseno dos pixels de uma imagem. Posso carregar, fazer o download e alterar valores quando carregar dados quando a GPU tiverCV_8UC1 dados, mas caracteres ...