Результаты поиска по запросу "micro-optimization"

1 ответ

Передача нулевого указателя на размещение нового

Размещение по умолчаниюnew Оператор объявлен в 18.6 [support.dynamic] ¶1 с ненулевой спецификацией исключения: void* operator new (std::size_t size, void* ptr) noexcept;Эта функция не делает ничего, кромеreturn ptr; поэтому разумноnoexceptоднако ...

4 ответа

Branch alignment for loops involving micro-coded instructions on Intel SnB-family CPUs

Это связано, но не так, как этот вопрос:Оптимизация производительности сборки x86-64 - выравнивание и прогноз ветвления и немного связан с моим предыдущим во...

6 ответов

Как: встроенный ассемблер в C ++ (под Visual Studio 2010)

Я пишу критический для производительности проект C ++, в котором 70% времени используется модулем ядра из 200 строк.Я бы хотел оптимизировать ядро, используя...

ТОП публикаций

1 ответ

Каков наилучший способ установить регистр в ноль в сборке x86: xor, mov или и?

2 ответа

Проверьте, равен ли регистр нулю с CMP reg, 0 против OR reg, reg?

Есть ли разница в скорости выполнения с использованием следующего кода:

2 ответа

Инструкция INC против ADD 1: имеет ли это значение?

5 ответов

Использование lazy val для кэширования строковых представлений

Я обнаружил следующий код в специальном выпуске Scala от JAXMag:

1 ответ

Почему DateTime.Now DateTime.UtcNow такой медленный / дорогой

Я понимаю, что это слишком далеко в области микрооптимизации, но мне любопытно понять, почему вызовы DateTime.Now и DateTime.UtcNow такие «дорогие». У меня е...

2 ответа

Можно ли сказать предиктору ветки, насколько вероятно следовать за веткой?

Просто чтобы прояснить, я не собираюсь здесь переносить что-либо, поэтому любые решения, которые привязывают меня к определенной коробке, вполне подойдут. По сути, у меня есть оператор if, который в 99% случаев оценивается как true, и я пытаюсь ...

1 ответ

Однако будущее неясно, и дело в этом хорошее, но гораздо более общее: кажется, что компиляторы и разработчики в основном не имеют никакой поддержки и не тратят много времени на размышления об этой мета-оптимизации «более высокого уровня», когда вам в основном приходится заранее определите, может ли вся ваша кодовая база (или, по крайней мере, какой-то большой кусок во время выполнения) использовать расширения A, B, C и т. д. Каждое обсуждение небольшой функции теперь должно быть обусловлено предостережением о турбо частотах, и мы не Я даже не говорил о том, как весы скользят с активными ядрами!

ой ассемблер кода Можете ли вы встроить его в C ++ и проверить по SSE4? На скорости Мне бы очень хотелось увидеть, как шагнуло в развитие SSE4. Или его совсем не беспокоит? Давайте проверим (у меня нет поддержки выше SSSE3) { sse2 strcmp ...