Suchergebnisse für Anfrage "simd"

ch kenne 3 Methoden, aber soweit ich weiß, werden im Allgemeinen nur die ersten 2 verwende Maskiere das Vorzeichen-Bit mitandps oderandnotps. Pros: Eine schnelle Anweisung, wenn sich die Maske bereits in einem Register befindet, was sie perfekt ...

c++x86 sse intrinsics

8 die antwort

SSE2 intrinsics - vergleicht vorzeichenlose ganze Zahlen

Ich bin daran interessiert, überlaufende Werte beim Hinzufügen von 8-Bit-Ganzzahlen ohne Vorzeichen zu identifizieren und das Ergebnis in 0xFF zu sättigen: __m128i m1 = _mm_loadu_si128(/* 16 8-bit unsigned integers */); __m128i m2 ...

mono arrays c#performance

2 die antwort

SSE-Befehl zum Überprüfen, ob das Byte-Array Nullen enthält. C #

ngenommen, ich habe einbyte[] und möchten überprüfen, ob alle Bytes Nullen sind. For-Schleife ist ein naheliegender Weg, und LINQAll() ist eine ausgefallene Methode, aber höchste Leistung ist entscheidend. Wie kann ich @ verwend ...

TOP-Veröffentlichungen

The In-Depth Guide on Video Streaming Protocols [for non-tech founders]

Wie erstellt man eine Krypto-Tauschbörse?

sse visual-c++auto-vectorization avx

4 die antwort

Wie schreibe ich C ++ - Code, den der Compiler effizient in SSE oder AVX kompilieren kann?

Nehmen wir an, ich habe eine in c ++ geschriebene Funktion, die Matrixvektormultiplikationen mit vielen Vektoren ausführt. Es wird ein Zeiger auf das zu transformierende Array von Vektoren benötigt. Kann ich zu Recht davon ausgehen, dass der ...

sse c x86

6 die antwort

Wie führe ich eine Uint32 / Float-Konvertierung mit SSE durch?

n SSE gibt es eine Funktion_mm_cvtepi32_ps(__m128i input), der einen Eingabevektor mit 32 Bit breiten Ganzzahlen mit Vorzeichen verwendet int32_t) und konvertiert sie infloat s. Now, ich möchte Eingabe-Ganzzahlen als nicht signiert ...

c++avx2 sse avx

2 die antwort

Laden von 8 Zeichen aus dem Speicher in eine __m256-Variable als gepackte Gleitkommazahlen mit einfacher Genauigkeit

Ich optimiere einen Algorithmus für die Gaußsche Unschärfe in einem Bild und möchte die Verwendung eines Float-Puffers [8] im folgenden Code durch eine intrinsische Variable __m256 ersetzen. Welche Anweisungsreihe eignet sich am besten für diese ...

ryujit .net c#

2 die antwort

Was sind diese zusätzlichen Anweisungen zur Demontage bei Verwendung von SIMD intrinsics?

Ich teste, welche Beschleunigung ich durch die Verwendung von SIMD-Anweisungen mit RyuJIT erzielen kann, und es werden einige Anweisungen zur Demontage angezeigt, die ich nicht erwarte. Ich stütze den Code aufdieser ...

x86 floating-point assembly x86-64

4 die antwort

SIMD-Anweisungen für den Gleitkomma-Gleichheitsvergleich (mit NaN == NaN)

Welche Befehle würden zum Vergleichen von zwei 128-Bit-Vektoren verwendet, die aus 4 * 32-Bit-Gleitkommawerten bestehen? Gibt es eine Anweisung, die einen NaN-Wert auf beiden Seiten als gleich betrachtet? Wenn nicht, wie groß wäre die ...

c++x86 atoi sse

4 die antwort

Wie implementiere ich atoi mit SIMD?

Ich möchte versuchen, eine atoi-Implementierung mithilfe von SIMD-Anweisungen zu schreiben, die in @ enthalten sein sol RapidJSON [http://rapidjson.org/] (eine C ++ - JSON-Lese- / Schreibbibliothek). Derzeit wurden an anderen Stellen einige ...

avx x86 sse assembly

2 die antwort

Was sind die besten Befehlssequenzen, um Vektorkonstanten im laufenden Betrieb zu generieren?

"Best" bedeutet die wenigsten Anweisungen (oder die wenigsten Uops, wenn Anweisungen zu mehr als einem Uop decodieren). Die Größe des Maschinencodes in Bytes ist ein Leistungsmerkmal für die gleiche Anzahl von Eingaben. Konstante Generierung ...

Seite 6 von 8

4 567 8

Suchergebnisse für Anfrage "simd"

Schnellste Methode zur Berechnung des Absolutwerts mit SSE

SSE2 intrinsics - vergleicht vorzeichenlose ganze Zahlen

SSE-Befehl zum Überprüfen, ob das Byte-Array Nullen enthält. C #

Beliebte Schlagwörter

TOP-Veröffentlichungen

Wie schreibe ich C ++ - Code, den der Compiler effizient in SSE oder AVX kompilieren kann?

Wie führe ich eine Uint32 / Float-Konvertierung mit SSE durch?

Laden von 8 Zeichen aus dem Speicher in eine __m256-Variable als gepackte Gleitkommazahlen mit einfacher Genauigkeit

Was sind diese zusätzlichen Anweisungen zur Demontage bei Verwendung von SIMD intrinsics?

SIMD-Anweisungen für den Gleitkomma-Gleichheitsvergleich (mit NaN == NaN)

Wie implementiere ich atoi mit SIMD?

Was sind die besten Befehlssequenzen, um Vektorkonstanten im laufenden Betrieb zu generieren?

Du bist sehr aktiv! Es ist großartig!

Suchergebnisse für Anfrage "simd"

Beliebte Schlagwörter

TOP-Veröffentlichungen