Suchergebnisse für Anfrage "sse"
pthreads v. SSE schwache Speicherordnung
Dienen die Linux-glibc-pthread-Funktionen auf x86_64 als Zäune für schwach geordnete Speicherzugriffe? (pthread_mutex_lock / unlock sind die genauen Funktionen, an denen ich interessiert bin). SSE2 stellt einige Anweisungen mit einer schwachen ...
Wie kann ich "_mm_storeu_epi64" ohne Aliasing-Probleme implementieren?
(Hinweis: Obwohl es sich bei dieser Frage um "Speichern" handelt, hat der "Laden" -Fall dieselben Probleme und ist perfekt symmetrisch.) Die SSE-Intrinsics bieten ...
SIMD-Optimierung von cvtColor mit ARM NEON intrinsics
Ich arbeite an einer SIMD-Optimierung von BGR zu Graustufen-Konvertierung, die äquivalent zu istOpenCV'scvtColor() Funktion [http://docs.opencv.org/2.4/modules/imgproc/doc/miscellaneous_transformations.html] . Es gibt eine Intel SSE-Version ...
Memset parallel zu Threads, die an jeden physischen Kern gebunden sind
Ich habe den Code unter getestetWäre es in einem OpenMP-Parallelcode von Vorteil, wenn memset parallel ausgeführt ...
Von Visual Studio 2013 Update 2 und Update 3 generierte SSE 4-Anweisungen
Wenn ich diesen Code in VS 2013 Update 2 oder Update 3 kompiliere: (unten steht Update 3) #include "stdafx.h" #include <iostream> #include <random> struct Buffer { long* data; int count; }; #ifndef max #define max(a,b) (((a) > (b)) ? (a) : ...
SSE-Multiplikation von 4 32-Bit-Ganzzahlen
Wie multipliziert man vier 32-Bit-Ganzzahlen mit vier weiteren Ganzzahlen? Ich habe keine Anweisung gefunden, die das kann.
Reduzierung der vorzeichenlosen Bytes ohne Überlauf mithilfe von SSE2 auf Intel
Ich versuche auf einem Intel i3 Prozessor eine Summenreduktion von 32 Elementen (jeweils 1 Byte Daten) zu finden. Ich tat dies:
SIMD und dynamische Speicherzuordnung [duplizieren]
Mögliche Duplikate:SSE, Eigenheiten und AusrichtungIch bin neu in der SIMD-Programmierung, bitte entschuldigen Sie, wenn ich eine offensichtliche Frage stell...
Wie man __m256 horizontal summiert?
Ich möchte die Komponenten von a horizontal summieren