Suchergebnisse für Anfrage "intrinsics"
Wann wird JVM Intrinsics verwenden?
Warum bestimmte Codemuster, wenn sie in internen JVM-Klassen vorhanden sind, in eine intrinsische Funktion umgewandelt werden, wohingegen dieselben Muster, w...
Was ist eigentlich?
Kann jemand erklären, was sie sind und warum ich sie brauchen würde? Welche Art von Anwendungen erstelle ich, wenn ich Intrinsics verwenden muss?
Initialisieren eines __m128-Typs von einem 64-Bit-Int. Ohne Vorzeichen
Das_mm_set_epi64 [http://msdn.microsoft.com/en-us/library/ecz16x1z%28v=vs.90%29.aspx]und ähnliche * _epi64-Anweisungen scheinen zu verwenden und hängen davon ab__m64 Typen. Ich möchte eine Variable vom Typ initialisieren__m128 so dass die oberen ...
Gibt es eine effizientere Möglichkeit, 4 aufeinanderfolgende Doubles in 4 YMM-Registern zu übertragen?
In einem Stück C ++ - Code, der etwas Ähnliches wie (aber nicht genau) Matrixmultiplikation ausführt, lade ich 4 zusammenhängende Doubles in 4 YMM-Register wie folgt: # a is a 64-byte aligned array of double __m256d b0 ...
Wie kann ich "_mm_storeu_epi64" ohne Aliasing-Probleme implementieren?
(Hinweis: Obwohl es sich bei dieser Frage um "Speichern" handelt, hat der "Laden" -Fall dieselben Probleme und ist perfekt symmetrisch.) Die SSE-Intrinsics bieten ...
Produce-Schleifen ohne cmp-Anweisung in GCC
Ich habe eine Reihe enger Schleifen, die ich mit GCC und Intrinsics optimieren möchte. Betrachten Sie zum Beispiel die folgende Funktion. void triad(float *x, float *y, float *z, const int n) { float k = 3.14159f; int i; __m256 k4 = ...
Horizontal hinzufügen mit __m512 (AVX512)
Wie führt man eine horizontale Addition mit Gleitkommazahlen in einem 512-Bit-AVX-Register effizient durch (dh addiert die Elemente aus einem einzelnen Vektor)? Für 128- und 256-Bit-Register kann dies mit _mm_hadd_ps und _mm256_hadd_ps erfolgen, ...
Wie wirkt sich JitIntrinsicAttribute auf die Codegenerierung aus?
Ich habe den .NET-Quellcode durchsucht und @ gesehdieses Attribut [https://github.com/dotnet/corefx/blob/master/src/System.Numerics.Vectors/src/System/Numerics/JitIntrinsicAttribute.cs] . Es sagt Ein Attribut, das an JIT-interne Methoden / ...
unresolved external symbol __mm256_setr_epi64x
Ich habe AVX-Code mit g ++ geschrieben und debuggt und versuche jetzt, ihn mit MSVC zum Laufen zu bringen, aber ich bekomme immer wieder error LNK2019: nicht aufgelöstes externes Symbol __mm256_setr_epi64x, auf das in der Funktion "private: ...
Gibt es eine gute Referenz für ARM Neon Intrinsics?
Das ARM-Referenzhandbuch geht nicht zu detailliert auf die einzelnen Anweisungen ein http: //infocenter.arm.com/help/index.jsp? topic = / com.arm.doc.dui0348b ...