Suchergebnisse für Anfrage "sse"
Kann maximal 50% nicht überschreiten. theoretische Leistung auf Matrix multiplizieren
Problem Ich lerne etwas über HPC und Codeoptimierung. Ich versuche, die Ergebnisse in Gotos Seminalmatrix-Multiplikationspapier zu replizieren ...
Erste Schritte mit SSE
Ich möchte mehr über die Verwendung von erfahrenSSE.Welche Möglichkeiten gibt es zu lernen, neben dem offensichtlichen Lesen derSoftwareentwicklerhandbücher ...
Was ist die Bedeutung von "nicht temporären" Speicherzugriffen in x86
Dies ist eine etwas niedrigere Frage. In der x86-Assembly gibt es zwei SSE-Anweisungen: MOVDQA xmmi, m128 un MOVNTDQA xmmi, m128 Das IA-32 Software-Entwicklerhandbuch besagt, dass das NT in MOVNTDQA steht für Nicht zeitlich, und ansonsten ist ...
Was ist der Unterschied zwischen __popcnt () und _mm_popcnt_u32 ()?
MS Visual C ++ unterstützt 2 Varianten des Befehls popcnt auf CPUs mit SSE4.2:
Wie erkennt man, ob SSE2 in opencv aktiviert ist?
Ich habe eine Version von OpenCV 2.4.10 Library, die für Intel X64 unter Windows erstellt wurde. Wie kann ich wissen, ob CV_SSE2 aktiv ist? Ich habe den Code nicht. Ich habe nur die Bibliotheken, DLLs und Header. Vielen Dan
Intel Intrinsics-Handbuch - Latenz und Durchsatz
Kann jemand die in @ angegebenen Werte für Latenz und Durchsatz erkläreIntel Intrinsic Guide [https://software.intel.com/sites/landingpage/IntrinsicsGuide/#] ? Habe ich es richtig verstanden, dass die Latenz die Anzahl der Zeiteinheiten ist, die ...
SIMD und Differenz zwischen gepackter und skalarer Doppelgenauigkeit
Ich lese den Intrinsics-Leitfaden von Intel, während ich die SIMD-Unterstützung implementiere. Ich habe ein paar Verwirrungen und meine Fragen sind wie folgt.
sind statische / statische lokale SSE / AVX-Variablen, die ein xmm / ymm-Register blockieren?
Bei Verwendung von SSE-Intrinsics sind häufig Nullvektoren erforderlich. Eine Möglichkeit, die Erstellung einer Nullvariablen innerhalb einer Funktion zu vermeiden, wenn die Funktion aufgerufen wird (jedes Mal, wenn effektiv ...
Wie kann ich überprüfen, ob meine installierte Nummer mit dem SSE / SSE2-Befehlssatz kompiliert wurde?
Wie kann ich überprüfen, ob meine installierte Version von numpy mit dem SSE / SSE2-Befehlssatz kompiliert wurde? Ich weiß, dass einige Teile von Numpy BLAS ...