Suchergebnisse für Anfrage "avx"
Beispiele und Tutorials für Intel SSE und AVX [geschlossen]
Gibt es gute C / C ++ - Tutorials oder Beispiele zum Erlernen von Intel SSE- und AVX-Anweisungen?Ich habe auf Microsoft MSDN- und Intel-Sites nur wenige gefu...
SIMD minmag und maxmag
Ich möchte SIMD implementierenminmag und maxmag Funktionen [https://www.khronos.org/registry/cl/sdk/1.1/docs/man/xhtml/mag.html]. Soweit ich weiß, sind diese Funktionen minmag(a,b) = |a|<|b| ? a : b maxmag(a,b) = |a|>|b| ? a : bIch möchte diese ...
Wrapper für `__m256` erzeugt Segmentierungsfehler mit Konstruktor - Windows 64 + MinGW + AVX-Probleme
Ich habe eine Gewerkschaft, die so aussieht union bareVec8f { __m256 m256; //avx 8x float vector float floats[8]; int ints[8]; inline bareVec8f(){ } inline bareVec8f(__m256 vec){ this->m256 = vec; } inline bareVec8f &operator=(__m256 m256) { ...
Wie viele Taktzyklen kosten die AVX / SSE-Exponentiation auf einer modernen x86_64-CPU?
Wie viele Taktzyklen kosten die AVX / SSE-Exponentiation auf einer modernen x86_64-CPU? Ich bin über:pow(x, y) = exp(y*log(x)) [https://stackoverflow.com/questions/25936031/pow-for-sse-types] D. tue beidesexp() undlog() AVX x86_64-Anweisungen ...
Verwendung von SIMD / AVX / SSE zum Durchlaufen von Bäumen
Ich recherchiere gerade, ob es möglich ist, einen Baum von Van Emde Boas (oder einen Baum) schneller zu durchqueren. Bei einer einzelnen Suchabfrage als Eing...
Schnellste 64-Bit-Bevölkerungszahl (Hamming-Gewicht)
Ich musste das Hamming-Gewicht für einen recht schnellen kontinuierlichen Fluss von 64-Bit-Daten berechnen und das @ verwendepopcnt Montageanleitung wirft mir eine Ausnahme von meinem Intel Core i7-4650U. Ich habe die Freude meines Bibel-Hackers ...
praktisch BigNum AVX / SSE möglich?
SSE / AVX-Register können als Ganzzahl- oder Gleitkomma-BigNums angesehen werden. Das heißt, man könnte vernachlässigen, dass es überhaupt Fahrspuren gibt. Gibt es eine einfache Möglichkeit, diesen Standpunkt auszunutzen und diese Register ...
Was ist die Mindestversion von OS X für die Verwendung mit AVX / AVX2?
Ich habe eine Bildzeichnungsroutine, die mehrfach für SSE, SSE2, SSE3, SSE4.1, SSE4.2, AVX und AVX2 kompiliert wird. Mein Programm sendet dynamisch eine dieser binären Variationen, indem es die CPUID-Flags überprüft. nter Windows überprüfe ich ...