Результаты поиска по запросу "x86"

ема (подумайте о фазе пометки ГХ) У меня есть график «объектов», по которым мне нужно ходить, посещая все объекты.Я могу хранить в каждом объекте, если он был посещен.Все объекты хранятся в памяти и связаны друг с другом с помощью обычных ...

bit-manipulation sse avx2 simd

2 ответа

@PeterCordes Иногда код становится более понятным, когда вы пишете константы в виде двоичного файла. Это не тот случай, я признаю :-).

у преобразовать 8-битное целое число в массив размером 8 с каждым значением, содержащим битовое значение целого числа. Например: у меня естьint8_t x = 8; Я хочу преобразовать это вint8_t array_x = {0,0,0,0,1,0,0,0}; Это должно быть сделано ...

python performance cython numba

2 ответа

Как вы думаете, это связано с Pythran или Clang против GCC?

о я могу соответствовать производительности Numba при использовании Cython. Однако в этом примере мне не удалось это сделать - Numba примерно в 4 раза быстрее, чем версия моего Cython. Вот Cython-версия: %%cython -c=-march=native -c=-O3 cimport ...

ТОП публикаций

Test Test Test Test Test Test

21 Startup Ideas to Start Profitable Business in 2020

How To Build E-Learning Platform From Scratch: The Complex Guide From Idea to MVP

How to Raise Your Own SaaS Product off the Ground and Avoid Common Pitfalls

performance cpu-architecture assembly perf

2 ответа

Очень правдоподобно, что они смогли это измерить.

ал с кодом вэтот ответ [https://stackoverflow.com/a/50496379/5801661]Слегка модифицируя его: BITS 64 GLOBAL _start SECTION .text _start: mov ecx, 1000000 .loop: ;T is a symbol defined with the CLI (-DT=...) TIMES T imul eax, eax lfence TIMES T ...

linux performance rdtsc

0 ответов

например.

вая х86 спостоянный TSC [https://stackoverflow.com/a/51907627/149138], который полезен для измерения в реальном времени, как можно конвертировать между «единицами» эталонных циклов TSC и обычными человеческими единицами реального времени, такими ...

cpu-architecture intel amd memory-barriers

2 ответа

на процессорах AMD.

ледних документах Intel ISAlfence инструкция была определена каксериализация потока команд (предотвращение неправильного исполнения через него). В частности, описание [http://felixcloutier.com/x86/LFENCE.html]Инструкция включает в себя эту ...

compiler-construction cpu-architecture branch-prediction intel

3 ответа

@PeterCordes TAGE использует (частичные) теги, а BTB часто (частично) помечают (для обеспечения ассоциативности). В случае пропуска BTB может возникнуть подозрение на то, что ответвление выполнено (статический прогноз может быть сделан в то же время, когда целевой адрес будет доступен). Кстати, теплые ветви могут быть достаточно частыми как класс и индивидуально достаточно статически смещенными, чтобы сделать статическое предсказание полезным. (Процессор SPEC известен своими небольшими размерами веток; даже в gcc может быть не так много активных веток, как в некотором общем коде. Тесты руководствуются продуктами.)

тЯ знаю, что Intel внедрила несколько статических механизмов прогнозирования ветвлений в эти годы: [https://groups.google.com/forum/#!topic/mechanical-sympathy/pMN6TbXwOUc]80486 возраст: всегда не принимается Pentium4 возраст: назад взяты / ...

performance assembly intel micro-optimization

2 ответа

@BeeOnRope: они всегда имеют непосредственную ширину с регистром (кроме rax). Вот почему последние правки об этом говорят «al / ax / eax / rax, imm8 / 16/32/32». Может быть, я должен добавить «соответственно» к этим уже загроможденным предложениям.

Haswell и более ранних версиях обычно составляет 2 мопа с задержкой в 2 цикла, поскольку у мопов Intel традиционно может быть только 2 входа ( https://agner.org/optimize/ [https://agner.org/optimize/]). Broadwell / Skylake и более поздние ...