Suchergebnisse für Anfrage "sse"
Sind ältere SIMD-Versionen verfügbar, wenn neuere verwendet werden?
Wenn ich SSE3 oder AVX nutzen kann, stehen dann ältere SSE-Versionen als SSE2 oder MMX zur Verfügung - oder muss ich immer noch separat nach ihnen suchen?
SIMD minmag und maxmag
Ich möchte SIMD implementierenminmag und maxmag Funktionen [https://www.khronos.org/registry/cl/sdk/1.1/docs/man/xhtml/mag.html]. Soweit ich weiß, sind diese Funktionen minmag(a,b) = |a|<|b| ? a : b maxmag(a,b) = |a|>|b| ? a : bIch möchte diese ...
Wie viele Taktzyklen kosten die AVX / SSE-Exponentiation auf einer modernen x86_64-CPU?
Wie viele Taktzyklen kosten die AVX / SSE-Exponentiation auf einer modernen x86_64-CPU? Ich bin über:pow(x, y) = exp(y*log(x)) [https://stackoverflow.com/questions/25936031/pow-for-sse-types] D. tue beidesexp() undlog() AVX x86_64-Anweisungen ...
Wie konvertiere ich ein hexadezimales float in ein float in C / C ++ mit der _mm_extract_ps SSE GCC instrinc Funktion
Ich schreibe einen SSE-Code für die 2D-Faltung, aber die SSE-Dokumentation ist sehr spärlich. Ich berechne das Skalarprodukt mit _mm_dp_ps und verwende _mm_extract_ps, um das Skalarprodukt-Ergebnis zu erhalten, aber _mm_extract_ps gibt ein Hex ...
Sind verschiedene mmx-, sse- und avx-Versionen komplementär oder übergeordnet?
Ich denke, ich sollte mich mit x86-SIMD-Erweiterungen vertraut machen. Aber bevor ich überhaupt angefangen habe, bin ich in Schwierigkeiten geraten. Ich kann keine gute Übersicht darüber finden, welche davon noch relevant sind. Die ...
Wie aktiviere ich SSE für meinen freistehenden bootfähigen Code?
(Diese Frage betraf ursprünglich dasCVTSI2SD Anweisung und die Tatsache, dass ich dachte, dass es auf der Pentium M-CPU nicht funktioniert, aber tatsächlich, weil ich ein benutzerdefiniertes Betriebssystem verwende und SSE manuell aktivieren ...
Write x86 asm funktioniert portabel (win / linux / osx), ohne dass ein Build von yasm / nasm abhängt?
par2 [https://github.com/Parchive/par2cmdline] hat eine kleine und ziemlich saubere C ++ - Codebasis, die meiner Meinung nach gut unter GNU / Linux, OS X und Windows (mit MSVC ++) funktioniert. Ich möchte eine x86-64-asm-Version der einen ...
C ++ - Fehler: "_mm_sin_ps" wurde in diesem Bereich nicht deklariert.
Ich versuche, verschiedene Methoden zum Anwenden einer Funktion auf ein Array zu vergleichen. warum ...
Warum optimieren GCC oder Clang bei Verwendung von fast-math nicht den Kehrwert von 1 Anweisung?
Weiß jemand, warum GCC / Clang nicht optimistisch funktionieren wird test1 im folgenden Codebeispiel, um bei Verwendung der Option fast-math einfach nur den RCPPS-Befehl zu verwenden? Gibt es ein anderes Compiler-Flag, das diesen Code erzeugen ...
Nicht temporäre Lasten und der Hardware-Prefetcher funktionieren zusammen?
Bei der Ausführung einer Reihe von_mm_stream_load_si128() Anrufe MOVNTDQA) Wird der Hardware-Pre-Fetcher von aufeinanderfolgenden Speicherorten noch aktiviert, oder sollte ich explizites Software-Prefetching (mit NTA-Hinweis) verwenden, um die ...