Wyniki wyszukiwania dla "avx"

2 odpowiedź

Jak korzystać z instrukcji Fused Multiply-Add (FMA) z SSE / AVX

Dowiedziałem się, że niektóre procesory Intel / AMD mogą wykonywać jednoczesne mnożenie i dodawać za pomocą SSE / AVX:FLOPS na cykl dla piaszczystego mostu i...

2 odpowiedź

wydajność SSE i AVX, gdy obie szerokości pasma pamięci są ograniczone

W poniższym kodzie zmieniłem „dataLen” i otrzymałem inną wydajność.dataLen = 400 SSE time: 758000 us AVX time: 483000 us SSE> AVXdataLen = 2400 SSE time: ...

2 odpowiedź

Scatter intrinsics w AVX

2 odpowiedź

Jaka jest różnica między vextracti128 i vextractf128?

4 odpowiedź

suma pozioma 8 upakowanych 32-bitowych pływaków

2 odpowiedź

Zapobieganie GCC automatycznie przy użyciu instrukcji AVX i FMA podczas kompilacji za pomocą -mavx i -mfma

Jak mogę wyłączyć automatyczną wektoryzację za pomocą instrukcji AVX i FMA? Nadal wolę, aby kompilator automatycznie używał SSE i SSE2, ale nie FMA i AVX.Mój...

2 odpowiedź

FLOPS na cykl dla piaszczystego mostu i haswell SSE2 / AVX / AVX2

Jestem zdezorientowany, ile klap na cykl na rdzeń można wykonać za pomocą Sandy-Bridge i Haswell. Jak rozumiem, w przypadku SSE powinno być 4 klapy na cykl n...

3 odpowiedź

Czy _mm_broadcast_ss jest szybszy niż _mm_set1_ps?

2 odpowiedź

Jak sumować __m256 poziomo?

5 odpowiedzi

Wydajność SSE-copy, AVX-copy i std :: copy

Próbowałem poprawić wydajność operacji kopiowania za pomocą SSE i AVX: