Resultados da pesquisa a pedido "nvprof"

1 a resposta

opção nvprof para largura de banda

Qual é a opção correta para medir a largura de banda usando o nvprof --metrics na linha de comando? Estou usando flop_dp_efficiency para obter a porcentagem de pico de FLOPS, mas parece haver muitas opções para medição de largura de banda no ...

1 a resposta

Como criar um perfil do aplicativo OpenCL com CUDA 8.0 nvprof

Estou tentando criar um perfil do aplicativo OpenCL,a.out, em um sistema com NVIDIA TITAN X e CUDA 8.0. Se fosse um aplicativo CUDA,nvprof ./a.out seria o suficiente. Mas descobri que isso não funciona com o aplicativo OpenCL, com a mensagem ...

2 a resposta

Como observar eventos e métricas CUDA para uma subseção de um executável (por exemplo, apenas durante o tempo de execução do kernel)?

Estou familiarizado com o uso do nvprof para acessar os eventos e métricas de uma referência, por exemplo, nvprof --system-profiling on --print-gpu-trace -o (file name) --events inst_issued1 ./benchmarknameo system-profiling on ...