Resultados de la búsqueda a petición "intel"

2 la respuesta

¿Cómo se programan exactamente los uops x86?

Las CPU x86 modernas descomponen el flujo de instrucciones entrantes en microoperaciones (uops1) y luego programar estos uopsfuera de servicio [https://en.wikipedia.org/wiki/Out-of-order_execution]a medida que sus entradas estén listas. Si bien ...

1 la respuesta

perf_event_open - cómo monitorear múltiples eventos

¿Alguien sabe cómo configurarperf_event_attr struct que puede activar PMU para monitorear eventos múltiples (tipo) a través deperf_event_open()? Me gustaperf record -e cycles,faults ls, tiene dos tipos de eventos diferentes (PERF_TYPE_HARDWARE y ...

2 la respuesta

¿Por qué este código SSE es 6 veces más lento sin VZEROUPPER en Skylake?

He estado tratando de resolver un problema de rendimiento en una aplicación y finalmente lo reduje a un problema realmente extraño. El siguiente código se ejecuta 6 veces más lento en una CPU Skylake (i5-6500) si elVZEROUPPER La instrucción está ...

2 la respuesta

¿Cuál fue la razón original del diseño de la sintaxis de ensamblaje de AT&T? [cerrado]

Al usar las instrucciones de montaje en x86 o amd64, el programador puede usar "Intel" (es decirnasm compilador) o "AT&T" (es decirgas compilador) sintaxis de ensamblaje. La sintaxis "Intel" es más popular en Windows, pero "AT&T" es más popular ...

1 la respuesta

¿Cuál es la semántica para los búferes Super Queue y Line Fill?

Estoy haciendo esta pregunta con respecto a Haswell Microarchitetcure (Intel Xeon E5-2640-v3 CPU). A partir de las especificaciones de la CPU y otros recursos, descubrí que hay 10 LFB y el tamaño de la super cola es 16. Tengo dos preguntas ...

1 la respuesta

¿Dónde debo poner ANNOTATE_ITERATION_TASK?

Estoy usando Intel Advisor para analizar mi aplicación paralela. Tengo este código, que es el bucle principal de mi programa y donde paso la mayor parte del tiempo: for(size_t i=0; i<wrapperIndexes.size(); i++){ const int r ...

2 la respuesta

cometer un error en el ensamblador en línea en gcc [duplicado]

Esta pregunta ya tiene una respuesta aquí: Obtener recuento de ciclos de CPU? [/questions/13772567/get-cpu-cycle-count] 4 respuestasHe escrito con éxito algún ensamblador en línea en gcc para rotar un bit a la derecha siguiendo algunas buenas ...

1 la respuesta

¿Había un modelo P4 con operaciones de doble bombeo de 64 bits?

Recuerdo que una de las características interesantes de la microarquitectura P4 inicial es que esALU de doble bombeo [http://www.realworldtech.com/forum/?threadid=2538&curpostid=2538]. Creo que Intel lo llamó algo así como elUnidad de Ejecución ...

0 la respuesta

Bucle de resto ineficaz en mi código

Tengo esta función: bool interpolate(const Mat &im, float ofsx, float ofsy, float a11, float a12, float a21, float a22, Mat &res) { bool ret = false; // input size (-1 for the safe bilinear interpolation) const int width = im.cols-1; const int ...

1 la respuesta

¿Cómo puedo crear el proyecto en Eclipse-nsight que usa Intel C ++ y CUDA C ++?

Quiero usar ICC (Intel C ++ Compiler) con CUDA NVCC (nVidia C ++ Compiler) en Linux en Eclipse-nsight. lo instaléCUDA 5.5 con Eclipse-nsight [https://developer.nvidia.com/cuda-downloads]yIntel Cluster Studio 2013 ...