Wyniki wyszukiwania dla "sse"
Mnożenie SSE 4 32-bitowych liczb całkowitych
Jak pomnożyć cztery 32-bitowe liczby całkowite przez kolejne 4 liczby całkowite? Nie znalazłem żadnej instrukcji, która mogłaby to zrobić.
Suma prefiksów SIMD w procesorze Intel
Muszę zaimplementować algorytm sumy przedrostkowej i będzie on musiał być tak szybki, jak to możliwe. Dawny:
SSE: odwrotność, jeśli nie zero
Jak mogę wziąć odwrotność (odwrotność) pływaków z instrukcjami SSE, aletylko dla niezerowych wartości?Poniżej tło:Chcę normalizować tablicę wektorów, aby każ...
Czy kompilatory JIT JVM generują kod, który wykorzystuje wektorowe instrukcje zmiennoprzecinkowe?
Powiedzmy, że wąskim gardłem mojego programu Java jest naprawdę kilka wąskich pętli do obliczania wielu produktów kropek wektorowych. Tak, wyprofilowałem, ta...
Jaka jest różnica między __popcnt () a _mm_popcnt_u32 ()?
MS Visual C ++ obsługuje 2 smaki instrukcji popcnt na procesorach z SSE4.2:
Jak wykonać lewe przesunięcie elementu z __m128i?
Instrukcje przesunięcia SSE, które znalazłem, mogą przesuwać się tylko o tę samą wartość na wszystkie elementy:
Pliki nagłówkowe dla elementów wewnętrznych SIMD x86
Które pliki nagłówkowe zawierają elementy wewnętrzne dla różnych rozszerzeń zestawu instrukcji SIMD x86 (MMX, SSE, AVX, ...)? Wydaje się niemożliwe znalezien...