Результаты поиска по запросу "x86"

1 ответ

@HadiBrais: не стесняйтесь пытаться ответить на вопрос более просто. Я могу занять немного больше времени, чтобы сделать более простое резюме. Но, как я уже сказал, я не знаю, спрашивает ли OP о чистых барьерах памяти в теоретической чистой / простой архитектуре, или же они на самом деле спрашивают о барьерах x86 на реальных процессорах x86, которые осложняются всеми этими проблемами. Я не уверен, как сделать это более ясным, чем ответ BeeOnRope на предыдущий вопрос OP, который IMO четко объяснил разницу между OoO exec и переупорядочением памяти.

ал разные вещи о том, как работает барьер памяти. Например, пользовательJohanответ вэтот вопрос [https://stackoverflow.com/questions/42714599/is-a-memory-barrier-an-instruction-that-the-cpu-executes-or-is-it-just-a-marker] говорит, что барьер ...

3 ответа

 для некоторого обсуждения проблем, обнаруженных в стандарте C11.

структура данных содержит несколько элементов, ее атомарная версия не может (всегда) быть свободной от блокировки. Мне сказали, что это верно для больших типов, потому что процессор не может атомарно изменить данные без использования какой-либо ...

1 ответ

Я не думаю, что Xeon может ссылаться на Itanium, поскольку эти руководства касаются только архитектуры x86 и x86-64 (то, что Intel называет IA-32 и Intel-64).

6,lock-приставленные инструкции, такие какlock cmpxchg обеспечивают барьерную семантику в дополнение к их элементарной работе: для нормального доступа к памяти в областях памяти с обратной записью операции чтения и записи не переупорядочиваются ...

ТОП публикаций

1 ответ

http://felixcloutier.com/x86/MOV.html

исал небольшую сборку с синтаксисом AT & T и в настоящее время объявил три переменные в.data раздел. Однако, когда я пытаюсь переместить любую из этих переменных в регистр, такой как%eax, ошибка отgcc Поднялся. Код и сообщение об ошибке ...

1 ответ

@Zboson: GPU mandelbrot, вероятно, не о масштабировании или его полезности, а скорее о хорошо известной и простой проблеме с очень высокой вычислительной интенсивностью / низкой пропускной способностью памяти. (И цепочка зависимости данных, которая может ограничивать ILP). На этой странице были и другие ориентиры, но мне нравится Мандельброт.

ли выполнить арифметику с плавающей запятой половинной точности на чипах Intel? Я знаю, как загружать / хранить / преобразовывать числа с плавающей запятой половинной точности [1], но я не знаю, как добавить / умножить их без преобразования в ...

2 ответа

@BeeOnRope: Фраза пришла от «где находится буфер WC? Это буферы заполнения строки». Удалил неочевидное местоимение, оставшееся от этого, начиная с комментария, спасибо за указание, что началом ответа, вероятно, не должен быть разговор с вопросом.

изически подключается буфер Write-Combine? Я видел блок-схемы, иллюстрирующие ряд вариантов: Между L1 и контроллером памятиМежду буфером хранения ЦП и контроллером памятиМежду процессорами AGU и / или хранилищамиЭто зависит от микроархитектуры?

2 ответа

В операциях на уровне байтов неправильно сравнивать язык Си с другим языком. Если символ состоит как минимум из 1 байта, фильтр будет увеличиваться, когда требуется кодировка. Кроме того, группа символов (String) не считается типом данных в языке C (для этого каждое сравнение должно повторно анализировать группу символов в процессе). Производительность обеспечивается только в том случае, если передача данных между функциями имеет фиксированный тип (приемлемо). Короче говоря, в языке «C» нет стандартного типа данных с именем «String».

тало любопытно понять, как работает сравнение строк в python, когда я решал следующую проблему с примером алгоритма: Если заданы две строки, вернуть длину самого длинного общего префикса Решение 1: charByCharМоя интуиция подсказала мне, что ...

1 ответ

 итерации, оставшейся до крайнего срока, оставайтесь в очень маленькой петле задержки на оставшееся время. Большинство проблем петель задержки устраняются, если они очень короткие.

по этой ссылкезадержка в сборке [https://stackoverflow.com/questions/15201955/how-to-set-1-second-time-delay-at-assembly-language-8086] добавить задержку в сборке. Я хочу провести некоторый эксперимент, добавив другое значение ...

1 ответ

 никогда не приводит к слиянию.

сто собиралсяэтот ответ Питера Кордеса [https://stackoverflow.com/a/36510865/124486]и он говорит, Частичные остановки флагов происходят при чтении флагов, если они вообще происходят. У P4 никогда не бывает киосков с частичным флагом, потому что ...

4 ответа

 и тому подобное вполне достаточно для реализации зацикливания

ли рассчитать результат умножения без использования инструкций MUL, IMUL, SHL, SHR, LOOP, JMP на языке ассемблера x86?