Resultados de la búsqueda a petición "profiling"

4 la respuesta

¿Cómo determino el número de instrucciones de máquina x86 ejecutadas en un programa en C?

Actualmente estoy trabajando en un problema de tarea que me pide que averigüe la cantidad de instrucciones de código de máquina que se ejecutan al ejecutar un programa corto que escribí en C. La pregunta dice que soy capaz de usar cualquier ...

1 la respuesta

Diferencia en el rendimiento: std :: acumular vs std :: inner_product vs Loop

Hoy, quiero compartir algo que me dejó boquiabierto cuando intenté implementar esta operación simple: [/imgs/o8JfI.gif] Encontré diferentes formas de realizar la misma operación: Usando lastd::inner_product.Implementar un predicado y usar ...

1 la respuesta

l informe @perf muestra esta función "__memset_avx2_unaligned_erms" tiene sobrecarga. ¿Significa esto que la memoria no está alineada?

Estoy tratando de perfilar mi código C ++ usando la herramienta perf. La implementación contiene código con instrucciones SSE / AVX / AVX2. Además de que el código se compila con-O3 -mavx2 -march=native banderas. ...

0 la respuesta

Datos de depuración / riesgos de rendimiento de neón en el código de neón del brazo

Originalmente el problema apareció cuando intentéoptimizar un algoritmo [https://stackoverflow.com/questions/49928749/efficiently-compute-max-of-an-array-of-8-elements-in-arm-neon] para el brazo de neón y una pequeña parte de él tomaba el 80% de ...

1 la respuesta

¿Cómo perfilar el uso de CPU de un script Python?

Idealmente, lo que quiero es registrar el uso de CPU de un script de Python que está ejecutando una red neuronal profundaKeras [https://keras.io/]modelo. Estoy buscando el equivalente de CPU ...

2 la respuesta

Fiabilidad del perfil de tiempo de desmontaje del instrumento Xcode

He perfilado mi código usando el generador de perfiles de tiempo del Instrumento, y al acercarme al desmontaje, aquí hay un fragmento de sus resultados: [/imgs/dAzUD.png] No esperaría unmov instrucciones para tomar el 23.3% del tiempo ...

2 la respuesta

Medición del tiempo de ejecución de funciones incorporadas para hoja de cálculo

¿Existen métodos para medir el tiempo de ejecución cuando las funciones integradas se completan para la hoja de cálculo? Cuando uso varias funciones integradas (por ejemplo, IMPORTHTML e IMPORTXML), si conozco el tiempo de ejecución promedio, es ...

1 la respuesta

Perfile nativamente múltiples scripts en PHP7

Desde el lanzamiento de PHP 7 ahora no es posible perfilar una selección completa de scripts usandodeclare(ticks=1) en su archivo base y luego usandoregister_tick_function() para monitorear cada tic como ya no sigue incluyen rutas de acceso. De ...

1 la respuesta

Cómo perfilar la aplicación OpenCL con CUDA 8.0 nvprof

Estoy tratando de perfilar la aplicación OpenCL,a.out, en un sistema con NVIDIA TITAN X y CUDA 8.0. Si fue la aplicación CUDA,nvprof ./a.out seria suficiente. Pero descubrí que esto no funciona con la aplicación OpenCL, con un mensaje "No se ...

1 la respuesta

Spark: número de rendimiento inconsistente en la escala del número de núcleos

Estoy haciendo una prueba de escala simple en Spark usando benchmark de clasificación: desde 1 núcleo, hasta 8 núcleos. Noto que 8 núcleos es más lento que 1 núcleo. //run spark using 1 core spark-submit --master local[1] --class ...