Результаты поиска по запросу "avx2"

2 ответа

 микро-слияния. Глупые, глючные инструменты с закрытым исходным кодом.) Во всяком случае, это поднимает планку еще больше, чтобы любой другой подход конкурировать.

у ускорить следующую операцию с инструкциями AVX2, но я не смог найти способ сделать это. Мне дали большой массивuint64_t data[100000] из uint64_t и массивunsigned char indices[100000] байтов. Я хочу вывести массивuint64_t Out[256] где i-е ...

1 ответ

Удивительный ответ .. Спасибо, Питер.

аюсь профилировать мой код C ++ с помощью инструмента Perf. Реализация содержит код с инструкциями SSE / AVX / AVX2. В дополнение к этому код скомпилирован с-O3 -mavx2 -march=native флаги. я верю__memset_avx2_unaligned_erms функция ...

2 ответа

@PeterCordes Иногда код становится более понятным, когда вы пишете константы в виде двоичного файла. Это не тот случай, я признаю :-).

у преобразовать 8-битное целое число в массив размером 8 с каждым значением, содержащим битовое значение целого числа. Например: у меня естьint8_t x = 8; Я хочу преобразовать это вint8_t array_x = {0,0,0,0,1,0,0,0}; Это должно быть сделано ...

ТОП публикаций

3 ответа

Сжатие разреженного массива с использованием SIMD (AVX2)

У меня есть редкий массивa (в основном нули): unsigned char a[1000000];и я хотел бы создать массивb индексов к ненулевым элементамa используя инструкции SIMD для архитектуры Intel x64 с AVX2. Я ищу советы, как сделать это эффективно. В ...

2 ответа

В чем разница между vextracti128 и vextractf128?

vextracti128 а такжеvextractf128 имеют одинаковую функциональность, параметры и возвращаемые значения. Кроме того, один из них - набор инструкций AVX, а другой - AVX2. В чем разница?

2 ответа

Скаттер присущие в AVX

Я не могу найти их в Intel Intrinsic Guide v2.7. Вы знаете, поддерживают ли их наборы инструкций AVX или AVX2?

1 ответ

Почему некоторые задержки Haswell AVX объявлены Intel в 3 раза медленнее, чем Sandy Bridge?

В Intelintrinsics ...

1 ответ

Есть ли обратная инструкция к инструкции Movemask в Intel AVX2?

Инструкция (и) movemask берут __m256i и возвращают int32, где каждый бит (либо первые 4, 8 или все 32 бита в зависимости от типа входного векторного элемента) является старшим значащим битом соответствующего векторного элемента. Я хотел бы ...

2 ответа

Самый быстрый способ умножения массива int64_t?

Я хочу векторизовать умножение двух выровненных массивов памяти. Я не нашел способа умножить 64 * 64 бит в AVX / AVX2, поэтому я просто развернул петлю и загрузил / сохранил AVX2. Есть ли более быстрый способ сделать это? Заметка Я не хочу ...