Resultados da pesquisa a pedido "nvprof"
opção nvprof para largura de banda
Qual é a opção correta para medir a largura de banda usando o nvprof --metrics na linha de comando? Estou usando flop_dp_efficiency para obter a porcentagem de pico de FLOPS, mas parece haver muitas opções para medição de largura de banda no ...
Como criar um perfil do aplicativo OpenCL com CUDA 8.0 nvprof
Estou tentando criar um perfil do aplicativo OpenCL,a.out, em um sistema com NVIDIA TITAN X e CUDA 8.0. Se fosse um aplicativo CUDA,nvprof ./a.out seria o suficiente. Mas descobri que isso não funciona com o aplicativo OpenCL, com a mensagem ...
Como observar eventos e métricas CUDA para uma subseção de um executável (por exemplo, apenas durante o tempo de execução do kernel)?
Estou familiarizado com o uso do nvprof para acessar os eventos e métricas de uma referência, por exemplo, nvprof --system-profiling on --print-gpu-trace -o (file name) --events inst_issued1 ./benchmarknameo system-profiling on ...