Resultados da pesquisa a pedido "profiling"
Como determinar o número de instruções da máquina x86 executadas em um programa
No momento, estou trabalhando em um problema de lição de casa que me pede para descobrir o número de instruções de código de máquina que são executadas ao executar um programa curto que escrevi em C. A pergunta diz que eu posso usar as ...
Diferença de desempenho: std :: acumulate vs std :: inner_product vs Loop
Hoje, quero compartilhar algo que me surpreendeu ao tentar implementar esta operação simples: [/imgs/o8JfI.gif] Encontrei maneiras diferentes de executar a mesma operação: Usando ostd::inner_product.Implementando um predicado e usando ...
O relatório perf mostra que esta função “__memset_avx2_unaligned_erms” possui sobrecarga. isso significa que a memória está desalinhada?
Estou tentando criar um perfil do meu código C ++ usando a ferramenta perf. A implementação contém código com instruções SSE / AVX / AVX2. Além desse código, é compilado com-O3 -mavx2 -march=native bandeiras. Acredito__memset_avx2_unaligned_erms ...
Riscos de desempenho de dados de depuração / néon no código de néon do braço
Originalmente, o problema apareceu quando tenteiotimizar um algoritmo [https://stackoverflow.com/questions/49928749/efficiently-compute-max-of-an-array-of-8-elements-in-arm-neon] para o braço de neon e uma parte menor estava consumindo 80% de ...
Como analisar o uso da CPU de um script Python?
Idealmente, o que eu quero é registrar o uso da CPU de um script Python que esteja executando uma rede neural profundaKeras [https://keras.io/]modelo. Estou procurando o equivalente da CPU ...
Confiabilidade do perfil do tempo de desmontagem do Xcode Instrument
Eu criei um perfil do meu código usando o criador de perfil de tempo do Instrument e, ampliando o zoom para a desmontagem, aqui está um trecho de seus resultados: [/imgs/dAzUD.png] Eu não esperaria ummov instruções para levar 23,3% do tempo ...
Medição do tempo de execução das funções internas da planilha
Existem métodos para medir o tempo de execução quando as funções internas são concluídas para a planilha? Quando uso várias funções internas (por exemplo, IMPORTHTML e IMPORTXML), se eu souber o tempo médio de execução, é fácil usar e projetar a ...
Perfil nativo de vários scripts em PHP7
Desde o lançamento do PHP 7, agora não é possível criar um perfil de uma seleção inteira de scripts usandodeclare(ticks=1) no seu arquivo base e, em seguida, usandoregister_tick_function() para monitorar cada marca, pois ela não segue mais os ...
Como criar um perfil do aplicativo OpenCL com CUDA 8.0 nvprof
Estou tentando criar um perfil do aplicativo OpenCL,a.out, em um sistema com NVIDIA TITAN X e CUDA 8.0. Se fosse um aplicativo CUDA,nvprof ./a.out seria o suficiente. Mas descobri que isso não funciona com o aplicativo OpenCL, com a mensagem ...
Spark: número de desempenho inconsistente no número de núcleos de escala
Estou fazendo um teste de escala simples no Spark usando classificação de classificação - de 1 núcleo até 8 núcleos. Percebo que 8 núcleos são mais lentos que 1 núcleo. //run spark using 1 core spark-submit --master local[1] --class ...