Suchergebnisse für Anfrage "sse"
Schnellste Methode zur Berechnung des Absolutwerts mit SSE
ch kenne 3 Methoden, aber soweit ich weiß, werden im Allgemeinen nur die ersten 2 verwende Maskiere das Vorzeichen-Bit mitandps oderandnotps. Pros: Eine schnelle Anweisung, wenn sich die Maske bereits in einem Register befindet, was sie perfekt ...
Wie erkennt man, ob SSE2 in opencv aktiviert ist?
Ich habe eine Version von OpenCV 2.4.10 Library, die für Intel X64 unter Windows erstellt wurde. Wie kann ich wissen, ob CV_SSE2 aktiv ist? Ich habe den Code nicht. Ich habe nur die Bibliotheken, DLLs und Header. Vielen Dan
Wie löse ich das 32-Byte-Alignment-Problem für AVX-Lade- / Speichervorgänge?
Ich habe ein Ausrichtungsproblem bei der Verwendung vonymm registriert, mit ein paar Codefragmenten, die mir in Ordnung erscheinen. Hier ist ein minimales Arbeitsbeispiel: #include <iostream> #include <immintrin.h> inline void ones(float *a) { ...
SSE2 intrinsics - vergleicht vorzeichenlose ganze Zahlen
Ich bin daran interessiert, überlaufende Werte beim Hinzufügen von 8-Bit-Ganzzahlen ohne Vorzeichen zu identifizieren und das Ergebnis in 0xFF zu sättigen: __m128i m1 = _mm_loadu_si128(/* 16 8-bit unsigned integers */); __m128i m2 ...
Wie schreibe ich C ++ - Code, den der Compiler effizient in SSE oder AVX kompilieren kann?
Nehmen wir an, ich habe eine in c ++ geschriebene Funktion, die Matrixvektormultiplikationen mit vielen Vektoren ausführt. Es wird ein Zeiger auf das zu transformierende Array von Vektoren benötigt. Kann ich zu Recht davon ausgehen, dass der ...
Berechnen Sie den absoluten Unterschied zwischen Ganzzahlen ohne Vorzeichen mit SSE
In C gibt es eine Technik ohne Verzweigung, um den absoluten Unterschied zwischen zwei vorzeichenlosen Ints zu berechnen? Zum Beispiel möchte ich bei den Variablen a und b den Wert 2 für Fälle, in denen a = 3, b = 5 oder b = 3, a = 5 ist. ...
Wie führe ich eine Uint32 / Float-Konvertierung mit SSE durch?
n SSE gibt es eine Funktion_mm_cvtepi32_ps(__m128i input), der einen Eingabevektor mit 32 Bit breiten Ganzzahlen mit Vorzeichen verwendet int32_t) und konvertiert sie infloat s. Now, ich möchte Eingabe-Ganzzahlen als nicht signiert ...
Laden von 8 Zeichen aus dem Speicher in eine __m256-Variable als gepackte Gleitkommazahlen mit einfacher Genauigkeit
Ich optimiere einen Algorithmus für die Gaußsche Unschärfe in einem Bild und möchte die Verwendung eines Float-Puffers [8] im folgenden Code durch eine intrinsische Variable __m256 ersetzen. Welche Anweisungsreihe eignet sich am besten für diese ...
Der beste Weg, um einen __m128i zu verschieben?
Ich muss eine __m128i-Variable (z. B. v) um m Bits verschieben, sodass sich die Bits durch die gesamte Variable bewegen (die resultierende Variable repräsentiert also v * 2 ^ m). Wie geht das am besten?! Beachten Sie, dass _mm_slli_epi64 v0 und ...
Was sind in GNU C inline asm die Modifikatoren für xmm / ymm / zmm für einen einzelnen Operanden?
Während ich versuche zu antworteningebettete Broadcasts mit Intrinsics und Assemb [https://stackoverflow.com/questions/34415238/embedded-broadcasts-with-intrinsics-and-assembly] , Ich habe versucht, so etwas zu tun: __m512 mul_broad(__m512 a, ...