Результаты поиска по запросу "avx"

0 ответов

Как получить данные из регистров AVX?

Используя MSVC 2013 и AVX 1, у меня есть 8 поплавков в регистре:

0 ответов

Как эффективно выполнять двойные / int64 преобразования с SSE / AVX?

В SSE2 есть инструкции для преобразования векторов между числами с плавающей точкой одинарной точности и 32-разрядными целыми числами.

0 ответов

Конвенция для отображения векторных регистров

ТОП публикаций

0 ответов

github.com/WojciechMula/sse-popcount/blob/master/...

множения больших двоичных матриц (10Kx20K) я обычно преобразую матрицы в числа с плавающей запятой и выполняю умножение матрицы с плавающей запятой, так как умножение целочисленной матрицы выполняется довольно медленно (посмотрите ...

0 ответов

@IwillnotexistIdonotexist: Хорошо заметили. Я думаю, это означает, что вы можете получить одну широкую запись MMIO для смежных немаскированных элементов или две узкие. Но выполнение одного выровненного 8-байтового атомарного хранилища все же дает атомарность для 4-байтовых половинок, хотя для MMIO это не так. Поэтому я не думаю, что это исключает атомарность для каждого элемента, потому что специфичная для реализации часть может быть только объединением хранилищ элементов в более широкие и все еще атомарные хранилища.

отрим массив какatomic<int32_t> shared_array[], Что делать, если вы хотите SIMD векторизацииfor(...) sum += shared_array[i].load(memory_order_relaxed)?. Или искать в массиве первый ненулевой элемент или обнулять его диапазон? Это, вероятно, ...

1 ответ

Неожиданно хорошая производительность с параллелью openmp для цикла

Я отредактировал свой вопрос после предыдущих комментариев (особенно @Zboson) для лучшей читаемостиЯ всегда действовал и следовал общепринятому мнению, что ч...

1 ответ

Самый быстрый способ распаковать 32 бита в 32-байтовый вектор SIMD

32 бита хранятся в

1 ответ

AVX внутри виртуальной машины VirtualBox?

Я устанавливаю последнюю версию Ubuntu 14.04 amd64 (gcc 4.8.2) в virtualbox, запускаю cat / proc / cpuinfo, получаю результат:Процессор CORE i52520M поддержи...

1 ответ

Разница между инструкциями AVX vxorpd и vpxor

1 ответ

Intel SIMD - как я могу проверить, содержит ли __m256 * ненулевые значения

Я использую компилятор Microsoft Visual Studio. Я пытаюсь выяснить, содержит ли 256-битный вектор ненулевые значения. я пытался