Suchergebnisse für Anfrage "intrinsics"

2 die antwort

Wann wird JVM Intrinsics verwenden?

Warum bestimmte Codemuster, wenn sie in internen JVM-Klassen vorhanden sind, in eine intrinsische Funktion umgewandelt werden, wohingegen dieselben Muster, w...

4 die antwort

Was ist eigentlich?

Kann jemand erklären, was sie sind und warum ich sie brauchen würde? Welche Art von Anwendungen erstelle ich, wenn ich Intrinsics verwenden muss?

3 die antwort

Initialisieren eines __m128-Typs von einem 64-Bit-Int. Ohne Vorzeichen

Das_mm_set_epi64 [http://msdn.microsoft.com/en-us/library/ecz16x1z%28v=vs.90%29.aspx]und ähnliche * _epi64-Anweisungen scheinen zu verwenden und hängen davon ab__m64 Typen. Ich möchte eine Variable vom Typ initialisieren__m128 so dass die oberen ...

TOP-Veröffentlichungen

3 die antwort

Gibt es eine effizientere Möglichkeit, 4 aufeinanderfolgende Doubles in 4 YMM-Registern zu übertragen?

In einem Stück C ++ - Code, der etwas Ähnliches wie (aber nicht genau) Matrixmultiplikation ausführt, lade ich 4 zusammenhängende Doubles in 4 YMM-Register wie folgt: # a is a 64-byte aligned array of double __m256d b0 ...

1 die antwort

Wie kann ich "_mm_storeu_epi64" ohne Aliasing-Probleme implementieren?

(Hinweis: Obwohl es sich bei dieser Frage um "Speichern" handelt, hat der "Laden" -Fall dieselben Probleme und ist perfekt symmetrisch.) Die SSE-Intrinsics bieten ...

3 die antwort

Produce-Schleifen ohne cmp-Anweisung in GCC

Ich habe eine Reihe enger Schleifen, die ich mit GCC und Intrinsics optimieren möchte. Betrachten Sie zum Beispiel die folgende Funktion. void triad(float *x, float *y, float *z, const int n) { float k = 3.14159f; int i; __m256 k4 = ...

2 die antwort

Horizontal hinzufügen mit __m512 (AVX512)

Wie führt man eine horizontale Addition mit Gleitkommazahlen in einem 512-Bit-AVX-Register effizient durch (dh addiert die Elemente aus einem einzelnen Vektor)? Für 128- und 256-Bit-Register kann dies mit _mm_hadd_ps und _mm256_hadd_ps erfolgen, ...

1 die antwort

Wie wirkt sich JitIntrinsicAttribute auf die Codegenerierung aus?

Ich habe den .NET-Quellcode durchsucht und @ gesehdieses Attribut [https://github.com/dotnet/corefx/blob/master/src/System.Numerics.Vectors/src/System/Numerics/JitIntrinsicAttribute.cs] . Es sagt Ein Attribut, das an JIT-interne Methoden / ...

4 die antwort

unresolved external symbol __mm256_setr_epi64x

Ich habe AVX-Code mit g ++ geschrieben und debuggt und versuche jetzt, ihn mit MSVC zum Laufen zu bringen, aber ich bekomme immer wieder error LNK2019: nicht aufgelöstes externes Symbol __mm256_setr_epi64x, auf das in der Funktion "private: ...

8 die antwort

Gibt es eine gute Referenz für ARM Neon Intrinsics?

Das ARM-Referenzhandbuch geht nicht zu detailliert auf die einzelnen Anweisungen ein http: //infocenter.arm.com/help/index.jsp? topic = / com.arm.doc.dui0348b ...