Результаты поиска по запросу "intel"
Как именно запланированы x86-мопы?
Современные процессоры x86 разбивают входящий поток команд на микрооперации1), а затем запланировать эти мопыне работает как их входы становятся готовыми. Хо...
Почему этот код SSE в 6 раз медленнее без VZEROUPPER на Skylake?
Я пытался выяснить проблему с производительностью в приложении и, наконец, сузил ее до действительно странной проблемы. Следующий фрагмент кода работает в 6 ...
CL_DEVICE_NOT_AVAILABLE с использованием процессора Intel Core 2 Duo E8500
Я получаю ошибкуCL_DEVICE_NOT_AVAILABLE при бегеэтот пример кода [https://stackoverflow.com/q/15499533/1397061], Однако, в отличие от этого вопроса, мой процессор, процессор Intel Core 2 Duo E8500, ...
для рабочего кода.
от вопрос уже есть ответ здесь:Получить количество тактов процессора? 4 ответаЯ успешно написал несколько встроенных ассемблеров в gcc, чтобы они вращались в...
Спасибо за ваш ответ. Я думал то же самое о распределении LFB для промахов L1D. Я вставляю копии нескольких строк из Руководства по оптимизации Intel. «Промах L1D создает запись в 16-ти элементном супер-очереди и выделяет буфер заполнения строки. Если строка найдена в кэше L2, она передается в кэш данных L1, и команда доступа к данным может обслуживаться. Задержка загрузки от L2 CACHE составляет 10 циклов, что приводит к снижению производительности примерно в 6 циклов, разнице в эффективных задержках L2 CACHE и L1D "
аю этот вопрос о Haswell Microarchitetcure (процессор Intel Xeon E5-2640-v3). Из спецификаций процессора и других ресурсов я узнал, что существует 10 LFB, а размер супер-очереди равен 16. У меня есть два вопроса, связанных с LFB ...