Результаты поиска по запросу "intel"

6 ответов

У процессоров Intel и AMD один и тот же ассемблер?

Язык C использовался для написания UNIX для достижения переносимости - одна и та же программа на языке C, скомпилированная с использованием разных компилятор...

1 ответ

 с точки зрения нативных векторов, как это делает GCC.

ствительно не могу понять, что такое "ключевое слово"__m128d находится в C ++. Я использую MSVC, иЭто [https://docs.microsoft.com/en-us/cpp/cpp/m128d?view=vs-2017]говорит:The __m128d data type, for use with the Streaming SIMD Extensions 2 ...

2 ответа

 на процессорах AMD.

ледних документах Intel ISAlfence инструкция была определена каксериализация потока команд (предотвращение неправильного исполнения через него). В частности, описание [http://felixcloutier.com/x86/LFENCE.html]Инструкция включает в себя эту ...

ТОП публикаций

3 ответа

@PeterCordes TAGE использует (частичные) теги, а BTB часто (частично) помечают (для обеспечения ассоциативности). В случае пропуска BTB может возникнуть подозрение на то, что ответвление выполнено (статический прогноз может быть сделан в то же время, когда целевой адрес будет доступен). Кстати, теплые ветви могут быть достаточно частыми как класс и индивидуально достаточно статически смещенными, чтобы сделать статическое предсказание полезным. (Процессор SPEC известен своими небольшими размерами веток; даже в gcc может быть не так много активных веток, как в некотором общем коде. Тесты руководствуются продуктами.)

тЯ знаю, что Intel внедрила несколько статических механизмов прогнозирования ветвлений в эти годы: [https://groups.google.com/forum/#!topic/mechanical-sympathy/pMN6TbXwOUc]80486 возраст: всегда не принимается Pentium4 возраст: назад взяты / ...

2 ответа

@BeeOnRope: они всегда имеют непосредственную ширину с регистром (кроме rax). Вот почему последние правки об этом говорят «al / ax / eax / rax, imm8 / 16/32/32». Может быть, я должен добавить «соответственно» к этим уже загроможденным предложениям.

Haswell и более ранних версиях обычно составляет 2 мопа с задержкой в ​​2 цикла, поскольку у мопов Intel традиционно может быть только 2 входа ( https://agner.org/optimize/ [https://agner.org/optimize/]). Broadwell / Skylake и более поздние ...

1 ответ

 более эффективен в SKL, но в конечном итоге все изменилось. Я предполагал, что ранние уархи были более эффективными, но, возможно, нет.

ался найти в Google мой вопрос, но, честно говоря, не знаю, как кратко сформулировать вопрос. Предположим, у меня есть два потока в многоядерной системе Intel. Эти потоки работают на том же узле NUMA. Предположим, что поток 1 записывает в X один ...

1 ответ

Удивительный ответ. Я ценю ссылку на таблицы Fogs, они отличный ресурс! Я принял ваш ответ - я поражен его полнотой!

етно это: mov %eax, %dsМедленнее чем mov %eax, %ebxИли они с одинаковой скоростью. Я исследовал онлайн, но не смог найти однозначного ответа. Я не уверен, что это глупый вопрос, но я думаю, что вполне возможно, что изменение регистра ...

1 ответ

Я не думаю, что Xeon может ссылаться на Itanium, поскольку эти руководства касаются только архитектуры x86 и x86-64 (то, что Intel называет IA-32 и Intel-64).

6,lock-приставленные инструкции, такие какlock cmpxchg обеспечивают барьерную семантику в дополнение к их элементарной работе: для нормального доступа к памяти в областях памяти с обратной записью операции чтения и записи не переупорядочиваются ...

1 ответ

ошибка

ая с OpenMP 4.0, определяемое пользователем сокращение поддерживается. Поэтому я определил сокращение на std :: vector в C ++ именно изВот [https://stackoverflow.com/a/43169193/5703783], Он отлично работает с GNU / 5.4.0 и GNU / 6.4.0, но ...

1 ответ

@Zboson: GPU mandelbrot, вероятно, не о масштабировании или его полезности, а скорее о хорошо известной и простой проблеме с очень высокой вычислительной интенсивностью / низкой пропускной способностью памяти. (И цепочка зависимости данных, которая может ограничивать ILP). На этой странице были и другие ориентиры, но мне нравится Мандельброт.

ли выполнить арифметику с плавающей запятой половинной точности на чипах Intel? Я знаю, как загружать / хранить / преобразовывать числа с плавающей запятой половинной точности [1], но я не знаю, как добавить / умножить их без преобразования в ...