Suchergebnisse für Anfrage "neon"

2 die antwort

Gängige SIMD-Techniken

Wo finde ich Informationen zu gängigen SIMD-Tricks? Ich habe einen Befehlssatz und weiß, wie man einfachen SIMD-Code schreibt, aber ich weiß, SIMD ist jetzt viel leistungsfähiger. Es kann komplexen bedingten Code ohne ...

1 die antwort

SIMD-Optimierung von cvtColor mit ARM NEON intrinsics

Ich arbeite an einer SIMD-Optimierung von BGR zu Graustufen-Konvertierung, die äquivalent zu istOpenCV'scvtColor() Funktion [http://docs.opencv.org/2.4/modules/imgproc/doc/miscellaneous_transformations.html] . Es gibt eine Intel SSE-Version ...

14 die antwort

Coding für ARM NEON: Wie fange ich an?

BACKGROUND (Überspringen Sie dies, wenn Sie möchten) Lassen Sie mich zunächst sagen, dass ich kein Experte Programmierer bin. Ich bin ein junger Junior Computer Vision (CV) Ingenieur, und ich bin ziemlich erfahren in der C ++ Programmierung, ...

TOP-Veröffentlichungen

8 die antwort

Gibt es eine gute Referenz für ARM Neon Intrinsics?

Das ARM-Referenzhandbuch geht nicht zu detailliert auf die einzelnen Anweisungen ein http: //infocenter.arm.com/help/index.jsp? topic = / com.arm.doc.dui0348b ...

4 die antwort

Übersetzen von SSE nach Neon: Packen und anschließendes Extrahieren des 32-Bit-Ergebnisses

Ich muss die folgenden Anweisungen von SSE nach Neon übersetzen uint32_t a = _mm_cvtsi128_si32(_mm_shuffle_epi8(a,SHUFFLE_MASK) );Wo static const __m128i SHUFFLE_MASK = _mm_setr_epi8(3, 7, 11, 15, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, ...

6 die antwort

Unter Verwendung einer Union (in einer Struktur gekapselt), um Konvertierungen für Neon-Datentypen zu umgehen

Ich habe meinen ersten Ansatz mit Vektorisierungs-Intrinsics mit SSE gemacht, wo es im Grunde nur einen Datentyp gibt__m128i. Beim Wechsel zu Neon stellte ich fest, dass die Datentypen und Funktionsprototypen sehr viel spezifischer ...

4 die antwort

gcc; arm64; aarch64; nicht erkannte Befehlszeilenoption '-mfpu = neon'

Ich habe einen Kompilierungsfehler: unbekannte Befehlszeilenoption '-mfpu = neon' * wenn versucht wurde mit -mfpu = neon flag zu kompilieren. Eigentlich sind alle 'mfpu'-Optionen, die ich ausprobiert habe, fehlgeschlagen. In der ...

6 die antwort

Wie verwende ich die Multiplikation und Akkumulation von Intrinsics in ARM Cortex-a8?

Wie verwende ich die von GCC bereitgestellten Multiplikations-Akkumulations-Eigenschaften? float32x4_t vmlaq_f32 (float32x4_t , float32x4_t , float32x4_t);Kann mir jemand erklären, welche drei Parameter ich an diese Funktion übergeben muss. Ich ...

2 die antwort

Wie verhindere ich, dass GCC meine NEON-Intrinsics zerstört?

Ich muss optimierten NEON-Code für ein Projekt schreiben, und ich schreibe gerne Assemblersprache, aber aus Gründen der Portabilität / Wartbarkeit verwende ich NEON-Instrumente. Dieser Code muss so schnell wie möglich sein, daher nutze ich meine ...

10 die antwort

Lade 8bit uint8_t als uint32_t?

my Bildverarbeitungsprojekt arbeitet mit Graustufenbildern. Ich habe eine ARM Cortex-A8-Prozessorplattform. Ich möchte das NEON nutzen. Ich habe ein Graustufenbild (siehe folgendes Beispiel) und muss in meinem Alogorithmus nur die Spalten ...