Wyniki wyszukiwania dla "sse"

2 odpowiedź

Wepchnij rejestr XMM na stos

2 odpowiedź

Mnożenie SSE 4 32-bitowych liczb całkowitych

Jak pomnożyć cztery 32-bitowe liczby całkowite przez kolejne 4 liczby całkowite? Nie znalazłem żadnej instrukcji, która mogłaby to zrobić.

4 odpowiedź

Suma prefiksów SIMD w procesorze Intel

Muszę zaimplementować algorytm sumy przedrostkowej i będzie on musiał być tak szybki, jak to możliwe. Dawny:

1 odpowiedź

SSE: odwrotność, jeśli nie zero

Jak mogę wziąć odwrotność (odwrotność) pływaków z instrukcjami SSE, aletylko dla niezerowych wartości?Poniżej tło:Chcę normalizować tablicę wektorów, aby każ...

1 odpowiedź

Jaka jest różnica między opcjami cflgs sse -msse, -msse2, -mssse3, -msse4 rtc ..? i jak określić?

8 odpowiedzi

Czy kompilatory JIT JVM generują kod, który wykorzystuje wektorowe instrukcje zmiennoprzecinkowe?

Powiedzmy, że wąskim gardłem mojego programu Java jest naprawdę kilka wąskich pętli do obliczania wielu produktów kropek wektorowych. Tak, wyprofilowałem, ta...

2 odpowiedź

Redukcja sumy niepodpisanych bajtów bez przepełnienia, przy użyciu SSE2 na Intel

1 odpowiedź

Jaka jest różnica między __popcnt () a _mm_popcnt_u32 ()?

MS Visual C ++ obsługuje 2 smaki instrukcji popcnt na procesorach z SSE4.2:

3 odpowiedź

Jak wykonać lewe przesunięcie elementu z __m128i?

Instrukcje przesunięcia SSE, które znalazłem, mogą przesuwać się tylko o tę samą wartość na wszystkie elementy:

5 odpowiedzi

Pliki nagłówkowe dla elementów wewnętrznych SIMD x86

Które pliki nagłówkowe zawierają elementy wewnętrzne dla różnych rozszerzeń zestawu instrukcji SIMD x86 (MMX, SSE, AVX, ...)? Wydaje się niemożliwe znalezien...