Suchergebnisse für Anfrage "sse"

Dienen die Linux-glibc-pthread-Funktionen auf x86_64 als Zäune für schwach geordnete Speicherzugriffe? (pthread_mutex_lock / unlock sind die genauen Funktionen, an denen ich interessiert bin). SSE2 stellt einige Anweisungen mit einer schwachen ...

strict-aliasing intrinsics c++

1 die antwort

Wie kann ich "_mm_storeu_epi64" ohne Aliasing-Probleme implementieren?

(Hinweis: Obwohl es sich bei dieser Frage um "Speichern" handelt, hat der "Laden" -Fall dieselben Probleme und ist perfekt symmetrisch.) Die SSE-Intrinsics bieten ...

neon opencv arm c++

1 die antwort

SIMD-Optimierung von cvtColor mit ARM NEON intrinsics

Ich arbeite an einer SIMD-Optimierung von BGR zu Graustufen-Konvertierung, die äquivalent zu istOpenCV'scvtColor() Funktion [http://docs.opencv.org/2.4/modules/imgproc/doc/miscellaneous_transformations.html] . Es gibt eine Intel SSE-Version ...

TOP-Veröffentlichungen

The In-Depth Guide on Video Streaming Protocols [for non-tech founders]

Wie erstellt man eine Krypto-Tauschbörse?

parallel-processing memset multithreading openmp

1 die antwort

Memset parallel zu Threads, die an jeden physischen Kern gebunden sind

Ich habe den Code unter getestetWäre es in einem OpenMP-Parallelcode von Vorteil, wenn memset parallel ausgeführt ...

c++11 c++visual-studio-2013

1 die antwort

Von Visual Studio 2013 Update 2 und Update 3 generierte SSE 4-Anweisungen

Wenn ich diesen Code in VS 2013 Update 2 oder Update 3 kompiliere: (unten steht Update 3) #include "stdafx.h" #include <iostream> #include <random> struct Buffer { long* data; int count; }; #ifndef max #define max(a,b) (((a) > (b)) ? (a) : ...

simd assembly x86

2 die antwort

Schieben Sie das XMM-Register in den Stapel

x86 multiplication sse2 simd

2 die antwort

SSE-Multiplikation von 4 32-Bit-Ganzzahlen

Wie multipliziert man vier 32-Bit-Ganzzahlen mit vier weiteren Ganzzahlen? Ich habe keine Anweisung gefunden, die das kann.

x86 sse3 simd sse2

2 die antwort

Reduzierung der vorzeichenlosen Bytes ohne Überlauf mithilfe von SSE2 auf Intel

Ich versuche auf einem Intel i3 Prozessor eine Summenreduktion von 32 Elementen (jeweils 1 Byte Daten) zu finden. Ich tat dies:

simd c++memory-management

2 die antwort

SIMD und dynamische Speicherzuordnung [duplizieren]

Mögliche Duplikate:SSE, Eigenheiten und AusrichtungIch bin neu in der SIMD-Programmierung, bitte entschuldigen Sie, wenn ich eine offensichtliche Frage stell...

avx intrinsics vectorization

2 die antwort

Wie man __m256 horizontal summiert?

Ich möchte die Komponenten von a horizontal summieren

Seite 3 von 12

1 234 5

Suchergebnisse für Anfrage "sse"

pthreads v. SSE schwache Speicherordnung

Wie kann ich "_mm_storeu_epi64" ohne Aliasing-Probleme implementieren?

SIMD-Optimierung von cvtColor mit ARM NEON intrinsics

Beliebte Schlagwörter

TOP-Veröffentlichungen

Memset parallel zu Threads, die an jeden physischen Kern gebunden sind

Von Visual Studio 2013 Update 2 und Update 3 generierte SSE 4-Anweisungen

Schieben Sie das XMM-Register in den Stapel

SSE-Multiplikation von 4 32-Bit-Ganzzahlen

Reduzierung der vorzeichenlosen Bytes ohne Überlauf mithilfe von SSE2 auf Intel

SIMD und dynamische Speicherzuordnung [duplizieren]

Wie man __m256 horizontal summiert?

Du bist sehr aktiv! Es ist großartig!

Suchergebnisse für Anfrage "sse"

Beliebte Schlagwörter

TOP-Veröffentlichungen