Suchergebnisse für Anfrage "sse"

6 die antwort

Sind ältere SIMD-Versionen verfügbar, wenn neuere verwendet werden?

Wenn ich SSE3 oder AVX nutzen kann, stehen dann ältere SSE-Versionen als SSE2 oder MMX zur Verfügung - oder muss ich immer noch separat nach ihnen suchen?

2 die antwort

SIMD minmag und maxmag

Ich möchte SIMD implementierenminmag und maxmag Funktionen [https://www.khronos.org/registry/cl/sdk/1.1/docs/man/xhtml/mag.html]. Soweit ich weiß, sind diese Funktionen minmag(a,b) = |a|<|b| ? a : b maxmag(a,b) = |a|>|b| ? a : bIch möchte diese ...

2 die antwort

Wie viele Taktzyklen kosten die AVX / SSE-Exponentiation auf einer modernen x86_64-CPU?

Wie viele Taktzyklen kosten die AVX / SSE-Exponentiation auf einer modernen x86_64-CPU? Ich bin über:pow(x, y) = exp(y*log(x)) [https://stackoverflow.com/questions/25936031/pow-for-sse-types] D. tue beidesexp() undlog() AVX x86_64-Anweisungen ...

TOP-Veröffentlichungen

6 die antwort

Wie konvertiere ich ein hexadezimales float in ein float in C / C ++ mit der _mm_extract_ps SSE GCC instrinc Funktion

Ich schreibe einen SSE-Code für die 2D-Faltung, aber die SSE-Dokumentation ist sehr spärlich. Ich berechne das Skalarprodukt mit _mm_dp_ps und verwende _mm_extract_ps, um das Skalarprodukt-Ergebnis zu erhalten, aber _mm_extract_ps gibt ein Hex ...

4 die antwort

Sind verschiedene mmx-, sse- und avx-Versionen komplementär oder übergeordnet?

Ich denke, ich sollte mich mit x86-SIMD-Erweiterungen vertraut machen. Aber bevor ich überhaupt angefangen habe, bin ich in Schwierigkeiten geraten. Ich kann keine gute Übersicht darüber finden, welche davon noch relevant sind. Die ...

4 die antwort

Wie aktiviere ich SSE für meinen freistehenden bootfähigen Code?

(Diese Frage betraf ursprünglich dasCVTSI2SD Anweisung und die Tatsache, dass ich dachte, dass es auf der Pentium M-CPU nicht funktioniert, aber tatsächlich, weil ich ein benutzerdefiniertes Betriebssystem verwende und SSE manuell aktivieren ...

2 die antwort

Write x86 asm funktioniert portabel (win / linux / osx), ohne dass ein Build von yasm / nasm abhängt?

par2 [https://github.com/Parchive/par2cmdline] hat eine kleine und ziemlich saubere C ++ - Codebasis, die meiner Meinung nach gut unter GNU / Linux, OS X und Windows (mit MSVC ++) funktioniert. Ich möchte eine x86-64-asm-Version der einen ...

6 die antwort

C ++ - Fehler: "_mm_sin_ps" wurde in diesem Bereich nicht deklariert.

Ich versuche, verschiedene Methoden zum Anwenden einer Funktion auf ein Array zu vergleichen. warum ...

2 die antwort

Warum optimieren GCC oder Clang bei Verwendung von fast-math nicht den Kehrwert von 1 Anweisung?

Weiß jemand, warum GCC / Clang nicht optimistisch funktionieren wird test1 im folgenden Codebeispiel, um bei Verwendung der Option fast-math einfach nur den RCPPS-Befehl zu verwenden? Gibt es ein anderes Compiler-Flag, das diesen Code erzeugen ...

8 die antwort

Nicht temporäre Lasten und der Hardware-Prefetcher funktionieren zusammen?

Bei der Ausführung einer Reihe von_mm_stream_load_si128() Anrufe MOVNTDQA) Wird der Hardware-Pre-Fetcher von aufeinanderfolgenden Speicherorten noch aktiviert, oder sollte ich explizites Software-Prefetching (mit NTA-Hinweis) verwenden, um die ...