Suchergebnisse für Anfrage "sse"

1 die antwort

Kann maximal 50% nicht überschreiten. theoretische Leistung auf Matrix multiplizieren

Problem Ich lerne etwas über HPC und Codeoptimierung. Ich versuche, die Ergebnisse in Gotos Seminalmatrix-Multiplikationspapier zu replizieren ...

3 die antwort

Erste Schritte mit SSE

Ich möchte mehr über die Verwendung von erfahrenSSE.Welche Möglichkeiten gibt es zu lernen, neben dem offensichtlichen Lesen derSoftwareentwicklerhandbücher ...

6 die antwort

Was ist die Bedeutung von "nicht temporären" Speicherzugriffen in x86

Dies ist eine etwas niedrigere Frage. In der x86-Assembly gibt es zwei SSE-Anweisungen: MOVDQA xmmi, m128 un MOVNTDQA xmmi, m128 Das IA-32 Software-Entwicklerhandbuch besagt, dass das NT in MOVNTDQA steht für Nicht zeitlich, und ansonsten ist ...

TOP-Veröffentlichungen

1 die antwort

Was ist der Unterschied zwischen __popcnt () und _mm_popcnt_u32 ()?

MS Visual C ++ unterstützt 2 Varianten des Befehls popcnt auf CPUs mit SSE4.2:

4 die antwort

Wie erkennt man, ob SSE2 in opencv aktiviert ist?

Ich habe eine Version von OpenCV 2.4.10 Library, die für Intel X64 unter Windows erstellt wurde. Wie kann ich wissen, ob CV_SSE2 aktiv ist? Ich habe den Code nicht. Ich habe nur die Bibliotheken, DLLs und Header. Vielen Dan

2 die antwort

Intel Intrinsics-Handbuch - Latenz und Durchsatz

Kann jemand die in @ angegebenen Werte für Latenz und Durchsatz erkläreIntel Intrinsic Guide [https://software.intel.com/sites/landingpage/IntrinsicsGuide/#] ? Habe ich es richtig verstanden, dass die Latenz die Anzahl der Zeiteinheiten ist, die ...

2 die antwort

SIMD und Differenz zwischen gepackter und skalarer Doppelgenauigkeit

Ich lese den Intrinsics-Leitfaden von Intel, während ich die SIMD-Unterstützung implementiere. Ich habe ein paar Verwirrungen und meine Fragen sind wie folgt.

1 die antwort

Implementierung eines C ++ - SSE-Filters

4 die antwort

sind statische / statische lokale SSE / AVX-Variablen, die ein xmm / ymm-Register blockieren?

Bei Verwendung von SSE-Intrinsics sind häufig Nullvektoren erforderlich. Eine Möglichkeit, die Erstellung einer Nullvariablen innerhalb einer Funktion zu vermeiden, wenn die Funktion aufgerufen wird (jedes Mal, wenn effektiv ...

3 die antwort

Wie kann ich überprüfen, ob meine installierte Nummer mit dem SSE / SSE2-Befehlssatz kompiliert wurde?

Wie kann ich überprüfen, ob meine installierte Version von numpy mit dem SSE / SSE2-Befehlssatz kompiliert wurde? Ich weiß, dass einige Teile von Numpy BLAS ...