Suchergebnisse für Anfrage "intrinsics"

1 die antwort

Wie lade ich eine Pixelstruktur in ein SSE-Register?

Ich habe eine Struktur von 8-Bit-Pixeldaten:

3 die antwort

Gibt es eine effizientere Möglichkeit, 4 aufeinanderfolgende Doubles in 4 YMM-Registern zu übertragen?

In einem Stück C ++ - Code, der etwas Ähnliches wie (aber nicht genau) Matrixmultiplikation ausführt, lade ich 4 zusammenhängende Doubles in 4 YMM-Register wie folgt: # a is a 64-byte aligned array of double __m256d b0 ...

8 die antwort

Wie verwende ich MSVC Intrinsics, um das Äquivalent dieses GCC-Codes zu erhalten?

Der folgende Code ruft die integrierten Funktionen für clz / ctz in GCC auf und verfügt auf anderen Systemen über C-Versionen. Offensichtlich sind die C-Versionen etwas suboptimal, wenn das System über einen eingebauten Befehl clz / ctz verfügt, ...

TOP-Veröffentlichungen

1 die antwort

C ++ Intrinsic nicht deklariert

Ich lerne die Verwendung von Intrinsics anstelle von Asm-Inlining. Gestern haben sie gearbeitet, aber heute bekomme ich immer Fehler. Hat nichts geändert.

4 die antwort

unresolved external symbol __mm256_setr_epi64x

Ich habe AVX-Code mit g ++ geschrieben und debuggt und versuche jetzt, ihn mit MSVC zum Laufen zu bringen, aber ich bekomme immer wieder error LNK2019: nicht aufgelöstes externes Symbol __mm256_setr_epi64x, auf das in der Funktion "private: ...

2 die antwort

Wie kann man die Histogrammstatistik mit Neon-Intrinsics optimieren?

Ich möchte den Histogramm-Statistikcode mit Neon-Intrinsics optimieren. Aber es gelang mir nicht. Hier ist der C-Code: #define NUM (7*1024*1024) uint8 src_data[NUM]; uint32 histogram_result[256] = {0}; for (int i = 0; i < NUM; i++) { ...

2 die antwort

Stellt eine abgebrochene xbegin-Transaktion den Stapelkontext wieder her, der beim xbegin-Start vorhanden war?

Ich bin daran interessiert, ein transaktionales xbegin und xend in XBEGIN () - und XEND () -Funktionen in einer statischen Assembler-Bibliothek zu kapseln. Es ist jedoch unklar, wie (oder ob) der Stapel in den ursprünglichen xbegin-Aufrufzustand ...

2 die antwort

Wie verhindere ich, dass GCC meine NEON-Intrinsics zerstört?

Ich muss optimierten NEON-Code für ein Projekt schreiben, und ich schreibe gerne Assemblersprache, aber aus Gründen der Portabilität / Wartbarkeit verwende ich NEON-Instrumente. Dieser Code muss so schnell wie möglich sein, daher nutze ich meine ...

1 die antwort

Trichterschicht - was ist das?

Beim Lesen des CUDA 5.0-Programmierhandbuchs bin ich auf eine Funktion namens &quot;Funnel Shift&quot; gestoßen, die in einem 3.5-Computer-fähigen Gerät vorh...

1 die antwort

Erfolgreiche Kompilierung des SSE-Befehls mit qmake (SSE2 wird jedoch nicht erkannt)