Результаты поиска по запросу "cpu-cache"

2 ответа

Как работает CLFLUSH для адреса, который еще не находится в кеше?

Мы пытаемся использовать инструкцию Intel CLFLUSH для очистки содержимого кэша процесса в Linux в пользовательском пространстве.Мы создаем очень простую C-пр...

0 ответов

Приблизительная стоимость доступа к различным кэшам и основной памяти?

Кто-нибудь может дать мне приблизительное время (в наносекундах) для доступа к кэшам L1, L2 и L3, а также к основной памяти на процессорах Intel i7?Хотя это ...

3 ответа

 результат для других процессоров в качестве операции согласования, как вы предполагаете.

ТОП публикаций

2 ответа

 по основной теме. Если это не так, вы можете сделать это так, выполняя работу во временном расположении для каждого работника, а затем обновляя общее местоположение только один раз, когда работа завершена. Любое повторное обновление одного и того же местоположения работниками будет просто ложным делением без реальной цели.

отреть возможностьN потоки, выполняющие асинхронные задачи с малым значением результата, напримерdouble или жеint64_t, Так о8 Значения результата могут занимать одну строку кэша ЦП.N равно количеству ядер процессора. С одной стороны, если я ...

2 ответа

stackoverflow.com/questions/43343231/...

вопросконкретнонацелена на современные архитектуры когерентного кэша x86-64 - я ценю ответ может быть другим на других процессорах. Если я записываю в память, протокол MESI требует, чтобы строка кэша сначала читалась в кэш, а затем изменялась в ...

1 ответ

, Я вижу, смогу ли я превратить его в модуль отключения кэша, если вы не против компилировать.

й современный высокопроизводительный ЦП архитектуры x86 / x86_64 имеет некоторую иерархию кэшей данных: L1, L2, а иногда и L3 (и L4 в очень редких случаях), и данные, загруженные из / в основную RAM, кэшируются в некоторых из них. Иногда ...

1 ответ

 Это простой кэш с прямым отображением и более сложный кэш с ассоциативным отображением. Вы хотите избежать случая, когда некоторому коду требуется две части информации, но эти два адреса отображаются на одну и ту же строку кэша.

аюсь понять, как работает кэш процессора. Допустим, у нас есть эта конфигурация (в качестве примера). Размер кэша 1024 байтаСтрока кэша 32 байта1024/32 = 32 строки кэша все вместе.Строка кэша Singel может хранить 32/4 = 8 дюймов.1) В ...

2 ответа

L2 - это ДЕВЯТЬ, это общий L3, который входит в состав Intel начиная с Nehalem. Таким образом, выселение потенциально может быть вызвано давлением со стороны других ядерных структур.

у вас есть 64-байтовый буфер, который интенсивно читается / записывается, то, вероятно, он будет сохранен в L1; но есть ли способ заставить это поведение? Например, предоставьте одному ядру монопольный доступ к этим 64 байтам и запретите им ...

4 ответа

К сожалению, мистер Гранлунд никогда не раскрывал свои методы выжать максимум из процессора - по крайней мере, я знаю об этом. Его программа GMPLIB может быть вам интересна, хотя бы для изучения его инструкций. Это математическая библиотека с произвольной точностью, которая используется, помимо прочего, для вычисления сотен миллионов десятичных чисел числа пи (gmplib.org). Его резюме в формате PDF о задержках команд на семейство процессоров также очень информативно.

аюсь понять принципы выравнивания машинного кода. У меня есть реализация на ассемблере, которая может генерировать машинный код во время выполнения. Я использую 16-байтовое выравнивание в каждом назначении ветви, но похоже, что это не оптимальный ...

1 ответ

Доступ к данным о производительности для L2 зависит от L2-контроллера. Я не знаю, сколько их существует, но для современных платформ A9 PL310 довольно распространен и имеет счетчики событий, которые могут захватывать запросы и попадания (http://infocenter.arm.com/help/index.jsp?topic = / com.arm.doc.ddi0246a / index.html). Хотя доступ к этим счетчикам может быть затруднен. Если вам повезет, ядро ​​может предложить интерфейс для этих регистров, но, скорее всего, нет, и что они недоступны из пользовательского пространства. В этом случае вам придется найти карту памяти для вашей платформы и написать модуль ядра или что-то в этом роде.

ел способ прочитать кэш L1 (данные и инструкции), используя http://infocenter.arm.com/help/index.jsp?topic=/com.arm.doc.faqs/ka4237.html [http://infocenter.arm.com/help/index.jsp?topic=/com.arm.doc.faqs/ka4237.html], Я тоже хочу прочитать ...