Suchergebnisse für Anfrage "sse"
Wie kann man steuern, ob C math SSE2 verwendet?
Mit MSVC trat ich in den Aufbau der transzendentalen mathematischen Funktionen der C-Bibliothek im fp: strict-Modus ein. Sie scheinen alle dem gleichen Muste...
Die beste Möglichkeit, eine 64-Bit-Ganzzahl in ein SSE2-Register mit doppelter Genauigkeit zu laden?
Was ist der beste / schnellste Weg, um einen 64-Bit-Integer-Wert in ein zu laden?
Wie können verschiedene Versionen von SSE intrinsics in GCC ordnungsgemäß verwendet werden?
Ich werde meine Frage anhand eines Beispiels stellen. Jetzt habe ich eine Funktion aufgerufen
Verwendung der FMA-Anweisungen (Fused Multiply-Add) mit SSE / AVX
Ich habe gelernt, dass einige Intel / AMD-CPUs mit SSE / AVX simultan multiplizieren und addieren können:FLOPS pro Zyklus für Sandbrücke und Haswell SSE2 / A...
SIMD und Differenz zwischen gepackter und skalarer Doppelgenauigkeit
Ich lese den Intrinsics-Leitfaden von Intel, während ich die SIMD-Unterstützung implementiere. Ich habe ein paar Verwirrungen und meine Fragen sind wie folgt.
SSE Integer Division?
Es gibt _mm_div_ps für die Division von Gleitkommawerten, es gibt _mm_mullo_epi16 für die ganzzahlige Multiplikation. Aber gibt es etwas für die Ganzzahldivi...
Wie kann ich überprüfen, ob meine installierte Nummer mit dem SSE / SSE2-Befehlssatz kompiliert wurde?
Wie kann ich überprüfen, ob meine installierte Version von numpy mit dem SSE / SSE2-Befehlssatz kompiliert wurde? Ich weiß, dass einige Teile von Numpy BLAS ...