Resultados da pesquisa a pedido "cuda"

O código de cublas abaixo nos dá os erros: núcleo despejado enquanto estiver em "cublasSnrm2 (identificador, linha, dy, incy, de)", você poderia dar alguns conselhos? main.cu #include <iostream> #include "cublas.h" #include "cublas_v2.h" ...

sorting struct

2 a resposta

Classificando matrizes de estruturas no CUDA

Eu tenho um laptop com uma placa gráfica NVIDIA GT750M 4Gb (capacidade de computação 3.0). Eu preciso classificar uma matriz de estruturas em CUDA (cerca de 3 × 10 ^ 7 elementos). Mas não consigo descobrir como, pois não tenho experiência ...

c++11 parallel-processing matrix

2 a resposta

Como executar várias multiplicações de matriz no CUDA?

Eu tenho uma matriz de matrizes quadradasint *M[10]; de modo aM[i] localiza o primeiro elemento doi-ª matriz. Eu quero multiplicar todas as matrizesM[i] por outra matrizN, para que eu receba uma matriz de matrizes quadradasint *P[10] como ...

nvidia

2 a resposta

Compreendendo as dimensões da grade CUDA, dimensões de bloco e organização de threads (explicação simples) [fechado]

Como os threads são organizados para serem executados por uma GPU?

1 a resposta

API matemática CUDA: diferença entre funções e intrínsecas

De acordo comAPDA de matemática CUDA [http://docs.nvidia.com/cuda/cuda-math-api/], muitas funções matemáticas, como seno e cosseno, são implementadas tanto em software (funções) quanto em hardware (intrínsecas). Esses intrínsecos provavelmente ...

c++euclidean-distance distance-matrix

1 a resposta

Exemplo de aumento do trabalho por thread no CUDA

Algoritmo : Estou escrevendo um programa com CUDA e o problema é o seguinte: Duas matrizes A (n * 128) e B (m * 128) Pego a primeira linha de A e calculo a distância entre esse vetor e todas as linhas de B, uma por uma. Eu escrevo o resultado ...

nvidia gpu tensorflow

1 a resposta

Uma placa Compute Capability 3.0 pode executar o tempo de execução Tensorflow 1.8 tensorflow-gpu?

Percorrendo o tutorial de instalação do Linux (Tensorflow 1.8) e não sei como interpretar a frase: Placa GPU com CUDA Compute Capability 3.0 ou superior para construção a partir da fonte e 3.5 ou superior para nossos binários. Consulte a ...

gpu graph-theory

2 a resposta

algoritmos de gráfico na GPU

os threads atuais da GPU são limitados de alguma forma (limite de memória, limite de estruturas de dados, sem recursão ...). você acha que seria viável implementar um problema de teoria dos grafos na GPU? por exemplo cobertura de vértice? ...

thrust

2 a resposta

Obtendo o CUDA Thrust para usar um fluxo CUDA de sua escolha

Observando os lançamentos do kernel dentro do código do CUDA Thrust, parece que eles sempre usam o fluxo padrão. Posso fazer o Thrust usar um fluxo de minha escolha? Estou faltando algo na API?

gpu c++opencv

2 a resposta

GpuMat personalizado do kernel com float

Estou tentando escrever um kernel personalizado usandoGpuMat dados para encontrar o arco cosseno dos pixels de uma imagem. Posso carregar, fazer o download e alterar valores quando carregar dados quando a GPU tiverCV_8UC1 dados, mas caracteres ...

Página 35 do 59

33 343536 37

Resultados da pesquisa a pedido "cuda"

Falha na segmentação ao passar o ponteiro do dispositivo para cublasSnrm2

Classificando matrizes de estruturas no CUDA

Como executar várias multiplicações de matriz no CUDA?

Tags populares

Compreendendo as dimensões da grade CUDA, dimensões de bloco e organização de threads (explicação simples) [fechado]

API matemática CUDA: diferença entre funções e intrínsecas

Exemplo de aumento do trabalho por thread no CUDA

Uma placa Compute Capability 3.0 pode executar o tempo de execução Tensorflow 1.8 tensorflow-gpu?

algoritmos de gráfico na GPU

Obtendo o CUDA Thrust para usar um fluxo CUDA de sua escolha

GpuMat personalizado do kernel com float

Você é muito ativo! É ótimo!

Resultados da pesquisa a pedido "cuda"

Tags populares