Suchergebnisse für Anfrage "sse"

3 die antwort

Wie kann man steuern, ob C math SSE2 verwendet?

Mit MSVC trat ich in den Aufbau der transzendentalen mathematischen Funktionen der C-Bibliothek im fp: strict-Modus ein. Sie scheinen alle dem gleichen Muste...

1 die antwort

Die beste Möglichkeit, eine 64-Bit-Ganzzahl in ein SSE2-Register mit doppelter Genauigkeit zu laden?

Was ist der beste / schnellste Weg, um einen 64-Bit-Integer-Wert in ein zu laden?

4 die antwort

Wie können verschiedene Versionen von SSE intrinsics in GCC ordnungsgemäß verwendet werden?

Ich werde meine Frage anhand eines Beispiels stellen. Jetzt habe ich eine Funktion aufgerufen

TOP-Veröffentlichungen

2 die antwort

Verwendung der FMA-Anweisungen (Fused Multiply-Add) mit SSE / AVX

Ich habe gelernt, dass einige Intel / AMD-CPUs mit SSE / AVX simultan multiplizieren und addieren können:FLOPS pro Zyklus für Sandbrücke und Haswell SSE2 / A...

7 die antwort

Einen kurzen Schwimmerguss beschleunigen?

2 die antwort

SIMD und Differenz zwischen gepackter und skalarer Doppelgenauigkeit

Ich lese den Intrinsics-Leitfaden von Intel, während ich die SIMD-Unterstützung implementiere. Ich habe ein paar Verwirrungen und meine Fragen sind wie folgt.

3 die antwort

Wird __int128_t-Arithmetik von GCC auch mit SSE emuliert?

4 die antwort

SSE Integer Division?

Es gibt _mm_div_ps für die Division von Gleitkommawerten, es gibt _mm_mullo_epi16 für die ganzzahlige Multiplikation. Aber gibt es etwas für die Ganzzahldivi...

3 die antwort

Wie kann ich überprüfen, ob meine installierte Nummer mit dem SSE / SSE2-Befehlssatz kompiliert wurde?

Wie kann ich überprüfen, ob meine installierte Version von numpy mit dem SSE / SSE2-Befehlssatz kompiliert wurde? Ich weiß, dass einige Teile von Numpy BLAS ...

4 die antwort

C ++ verwendet SSE-Anweisungen zum Vergleichen riesiger Vektoren von Ints