Результаты поиска по запросу "cpu-architecture"
Почему существует инструкция / выравнивание данных?
Я часто вижу информацию об архитектурных инструкциях, и данные должны быть выровнены по границам слова, полуслова и т. Д. Хотя следовать этим правилам неслож...
Определение архитектуры процессора во время компиляции
Какой самый надежный способ узнать архитектуру процессора при компиляции кода C или C ++? Насколько я могу судить, разные компиляторы имеют собственный набор...
Как бы вы обычно определяли ассоциативность строк кэша из кода пользовательского режима?
собираю небольшой патч дляинструмент cachegrind / callgrind в valgrind который будет автоматически обнаруживать, используя полностью общий код, инструкцию пр...
FLOPS за цикл для песчаного моста и скважины SSE2 / AVX / AVX2
Я не понимаю, сколько флопов за такт на ядро можно сделать с помощью Sandy-Bridge и Haswell. Насколько я понимаю, с SSE должно быть 4 флопа на такт на ядро д...
Почему деление дороже, чем умножение?
Я на самом деле не пытаюсь что-либо оптимизировать, но я помню, как постоянно слышал это от программистов, что я воспринимал это как правду. В конце концов, ...
Поведение / политика кэширования процессора для отображений памяти с файловой поддержкой?
Кто-нибудь знает, какой тип поведения или политики кэша ЦП (например, объединение без кэширования при записи) назначается отображаемой памяти?Файл спинками р...
Как использовать инструкции Fused Multiply-Add (FMA) с SSE / AVX
Я узнал, что некоторые процессоры Intel / AMD могут выполнять одновременное умножение и добавление с помощью SSE / AVX:FLOPS за цикл для песчаного моста и ск...
Как работает кэш с прямым отображением?
Я прохожу курс «Архитектура системы» и не могу понять, как работает кэш с прямым отображением.Я посмотрел в нескольких местах, и они объясняют это по-другому...
Требуется обходной путь Endianness
Рассмотрим следующий фрагмент кода: