Suchergebnisse für Anfrage "neon"
Gängige SIMD-Techniken
Wo finde ich Informationen zu gängigen SIMD-Tricks? Ich habe einen Befehlssatz und weiß, wie man einfachen SIMD-Code schreibt, aber ich weiß, SIMD ist jetzt viel leistungsfähiger. Es kann komplexen bedingten Code ohne ...
SIMD-Optimierung von cvtColor mit ARM NEON intrinsics
Ich arbeite an einer SIMD-Optimierung von BGR zu Graustufen-Konvertierung, die äquivalent zu istOpenCV'scvtColor() Funktion [http://docs.opencv.org/2.4/modules/imgproc/doc/miscellaneous_transformations.html] . Es gibt eine Intel SSE-Version ...
Coding für ARM NEON: Wie fange ich an?
BACKGROUND (Überspringen Sie dies, wenn Sie möchten) Lassen Sie mich zunächst sagen, dass ich kein Experte Programmierer bin. Ich bin ein junger Junior Computer Vision (CV) Ingenieur, und ich bin ziemlich erfahren in der C ++ Programmierung, ...
Gibt es eine gute Referenz für ARM Neon Intrinsics?
Das ARM-Referenzhandbuch geht nicht zu detailliert auf die einzelnen Anweisungen ein http: //infocenter.arm.com/help/index.jsp? topic = / com.arm.doc.dui0348b ...
Übersetzen von SSE nach Neon: Packen und anschließendes Extrahieren des 32-Bit-Ergebnisses
Ich muss die folgenden Anweisungen von SSE nach Neon übersetzen uint32_t a = _mm_cvtsi128_si32(_mm_shuffle_epi8(a,SHUFFLE_MASK) );Wo static const __m128i SHUFFLE_MASK = _mm_setr_epi8(3, 7, 11, 15, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, ...
Unter Verwendung einer Union (in einer Struktur gekapselt), um Konvertierungen für Neon-Datentypen zu umgehen
Ich habe meinen ersten Ansatz mit Vektorisierungs-Intrinsics mit SSE gemacht, wo es im Grunde nur einen Datentyp gibt__m128i. Beim Wechsel zu Neon stellte ich fest, dass die Datentypen und Funktionsprototypen sehr viel spezifischer ...
gcc; arm64; aarch64; nicht erkannte Befehlszeilenoption '-mfpu = neon'
Ich habe einen Kompilierungsfehler: unbekannte Befehlszeilenoption '-mfpu = neon' * wenn versucht wurde mit -mfpu = neon flag zu kompilieren. Eigentlich sind alle 'mfpu'-Optionen, die ich ausprobiert habe, fehlgeschlagen. In der ...
Wie verwende ich die Multiplikation und Akkumulation von Intrinsics in ARM Cortex-a8?
Wie verwende ich die von GCC bereitgestellten Multiplikations-Akkumulations-Eigenschaften? float32x4_t vmlaq_f32 (float32x4_t , float32x4_t , float32x4_t);Kann mir jemand erklären, welche drei Parameter ich an diese Funktion übergeben muss. Ich ...
Wie verhindere ich, dass GCC meine NEON-Intrinsics zerstört?
Ich muss optimierten NEON-Code für ein Projekt schreiben, und ich schreibe gerne Assemblersprache, aber aus Gründen der Portabilität / Wartbarkeit verwende ich NEON-Instrumente. Dieser Code muss so schnell wie möglich sein, daher nutze ich meine ...
Lade 8bit uint8_t als uint32_t?
my Bildverarbeitungsprojekt arbeitet mit Graustufenbildern. Ich habe eine ARM Cortex-A8-Prozessorplattform. Ich möchte das NEON nutzen. Ich habe ein Graustufenbild (siehe folgendes Beispiel) und muss in meinem Alogorithmus nur die Spalten ...