Suchergebnisse für Anfrage "sse"

1 die antwort

pthreads v. SSE schwache Speicherordnung

Dienen die Linux-glibc-pthread-Funktionen auf x86_64 als Zäune für schwach geordnete Speicherzugriffe? (pthread_mutex_lock / unlock sind die genauen Funktionen, an denen ich interessiert bin). SSE2 stellt einige Anweisungen mit einer schwachen ...

1 die antwort

Wie kann ich "_mm_storeu_epi64" ohne Aliasing-Probleme implementieren?

(Hinweis: Obwohl es sich bei dieser Frage um "Speichern" handelt, hat der "Laden" -Fall dieselben Probleme und ist perfekt symmetrisch.) Die SSE-Intrinsics bieten ...

1 die antwort

SIMD-Optimierung von cvtColor mit ARM NEON intrinsics

Ich arbeite an einer SIMD-Optimierung von BGR zu Graustufen-Konvertierung, die äquivalent zu istOpenCV'scvtColor() Funktion [http://docs.opencv.org/2.4/modules/imgproc/doc/miscellaneous_transformations.html] . Es gibt eine Intel SSE-Version ...

TOP-Veröffentlichungen

1 die antwort

Memset parallel zu Threads, die an jeden physischen Kern gebunden sind

Ich habe den Code unter getestetWäre es in einem OpenMP-Parallelcode von Vorteil, wenn memset parallel ausgeführt ...

1 die antwort

Von Visual Studio 2013 Update 2 und Update 3 generierte SSE 4-Anweisungen

Wenn ich diesen Code in VS 2013 Update 2 oder Update 3 kompiliere: (unten steht Update 3) #include "stdafx.h" #include <iostream> #include <random> struct Buffer { long* data; int count; }; #ifndef max #define max(a,b) (((a) > (b)) ? (a) : ...

2 die antwort

Schieben Sie das XMM-Register in den Stapel

2 die antwort

SSE-Multiplikation von 4 32-Bit-Ganzzahlen

Wie multipliziert man vier 32-Bit-Ganzzahlen mit vier weiteren Ganzzahlen? Ich habe keine Anweisung gefunden, die das kann.

2 die antwort

Reduzierung der vorzeichenlosen Bytes ohne Überlauf mithilfe von SSE2 auf Intel

Ich versuche auf einem Intel i3 Prozessor eine Summenreduktion von 32 Elementen (jeweils 1 Byte Daten) zu finden. Ich tat dies:

2 die antwort

SIMD und dynamische Speicherzuordnung [duplizieren]

Mögliche Duplikate:SSE, Eigenheiten und AusrichtungIch bin neu in der SIMD-Programmierung, bitte entschuldigen Sie, wenn ich eine offensichtliche Frage stell...

2 die antwort

Wie man __m256 horizontal summiert?

Ich möchte die Komponenten von a horizontal summieren