Resultados da pesquisa a pedido "profiling"

4 a resposta

Como determinar o número de instruções da máquina x86 executadas em um programa

No momento, estou trabalhando em um problema de lição de casa que me pede para descobrir o número de instruções de código de máquina que são executadas ao executar um programa curto que escrevi em C. A pergunta diz que eu posso usar as ...

1 a resposta

Diferença de desempenho: std :: acumulate vs std :: inner_product vs Loop

Hoje, quero compartilhar algo que me surpreendeu ao tentar implementar esta operação simples: [/imgs/o8JfI.gif] Encontrei maneiras diferentes de executar a mesma operação: Usando ostd::inner_product.Implementando um predicado e usando ...

1 a resposta

O relatório perf mostra que esta função “__memset_avx2_unaligned_erms” possui sobrecarga. isso significa que a memória está desalinhada?

Estou tentando criar um perfil do meu código C ++ usando a ferramenta perf. A implementação contém código com instruções SSE / AVX / AVX2. Além desse código, é compilado com-O3 -mavx2 -march=native bandeiras. Acredito__memset_avx2_unaligned_erms ...

0 a resposta

Riscos de desempenho de dados de depuração / néon no código de néon do braço

Originalmente, o problema apareceu quando tenteiotimizar um algoritmo [https://stackoverflow.com/questions/49928749/efficiently-compute-max-of-an-array-of-8-elements-in-arm-neon] para o braço de neon e uma parte menor estava consumindo 80% de ...

1 a resposta

Como analisar o uso da CPU de um script Python?

Idealmente, o que eu quero é registrar o uso da CPU de um script Python que esteja executando uma rede neural profundaKeras [https://keras.io/]modelo. Estou procurando o equivalente da CPU ...

2 a resposta

Confiabilidade do perfil do tempo de desmontagem do Xcode Instrument

Eu criei um perfil do meu código usando o criador de perfil de tempo do Instrument e, ampliando o zoom para a desmontagem, aqui está um trecho de seus resultados: [/imgs/dAzUD.png] Eu não esperaria ummov instruções para levar 23,3% do tempo ...

2 a resposta

Medição do tempo de execução das funções internas da planilha

Existem métodos para medir o tempo de execução quando as funções internas são concluídas para a planilha? Quando uso várias funções internas (por exemplo, IMPORTHTML e IMPORTXML), se eu souber o tempo médio de execução, é fácil usar e projetar a ...

1 a resposta

Perfil nativo de vários scripts em PHP7

Desde o lançamento do PHP 7, agora não é possível criar um perfil de uma seleção inteira de scripts usandodeclare(ticks=1) no seu arquivo base e, em seguida, usandoregister_tick_function() para monitorar cada marca, pois ela não segue mais os ...

1 a resposta

Como criar um perfil do aplicativo OpenCL com CUDA 8.0 nvprof

Estou tentando criar um perfil do aplicativo OpenCL,a.out, em um sistema com NVIDIA TITAN X e CUDA 8.0. Se fosse um aplicativo CUDA,nvprof ./a.out seria o suficiente. Mas descobri que isso não funciona com o aplicativo OpenCL, com a mensagem ...

1 a resposta

Spark: número de desempenho inconsistente no número de núcleos de escala

Estou fazendo um teste de escala simples no Spark usando classificação de classificação - de 1 núcleo até 8 núcleos. Percebo que 8 núcleos são mais lentos que 1 núcleo. //run spark using 1 core spark-submit --master local[1] --class ...