Suchergebnisse für Anfrage "x86"

4 die antwort

Wie kann ich gcc zwingen, eine Funktion direkt im PIC-Code aufzurufen?

Betrachten Sie die folgende Funktion: extern void test1(void); extern void test2(void) { test1(); }Dies ist der Code, den GCC generiert, ohne-fpic unter amd64 Linux: test2: jmp test1Wenn ich mit @ kompilie-fpic, gcc ruft explizit die PLT auf, ...

2 die antwort

Unroll-Schleife und unabhängige Summe mit Vektorisierung

Für die folgende Schleife wird GCC die Schleife nur vektorisieren, wenn ich ihr befehle, assoziative Mathematik zu verwenden, z. mit-Ofast. float sumf(float *x) { x = (float*)__builtin_assume_aligned(x, 64); float sum = 0; for(int i=0; i<2048; ...

2 die antwort

Assembly MASM Umgang mit negativen ganzen Zahlen

Ich wurde angewiesen, ein Programm in Assembly zu schreiben, das die folgende Arithmetik ausführt:((A + B) / C) * ((D - A) + E)Ich habe es geschafft, wenn ke...

TOP-Veröffentlichungen

2 die antwort

_mm_testc_ps und _mm_testc_pd vs _mm_testc_si128

Wie Sie wissen, handelt es sich bei den ersten beiden um AVX-spezifische Eigenschaften und bei der zweiten um SSE4.1-Eigenschaften. Beide Sätze von Intrinsics können verwendet werden, um die Gleichheit von 2 Gleitkommavektoren zu überprüfen. Mein ...

4 die antwort

Wie funktionieren Objekte in x86 auf Assembly-Ebene?

Ich versuche zu verstehen, wie Objekte auf Baugruppenebene funktionieren. Wie genau sind Objekte im Speicher abgelegt und wie greifen Member-Funktionen darauf zu? (Anmerkung der Redaktion: Die Originalversion warWe zu breit, und hatte ...

1 die antwort

SIMD den folgenden Code

Wie SIMIDiere ich den folgenden Code in C (natürlich unter Verwendung von SIMD intrinsics)? Ich habe Probleme, die SIMD-Eigenheiten zu verstehen, und das wür...

2 die antwort

Reduzierung der vorzeichenlosen Bytes ohne Überlauf mithilfe von SSE2 auf Intel

Ich versuche auf einem Intel i3 Prozessor eine Summenreduktion von 32 Elementen (jeweils 1 Byte Daten) zu finden. Ich tat dies:

4 die antwort

Wurzel auf x87-FPU mit der Newton-Raphson-Methode

Ich versuche, ein Assembly-Programm mit dem 8086-Prozessor zu schreiben, das die Kubikwurzel einer Zahl findet. Offensichtlich verwende ich Gleitkommazahlen. Algorithmus basierend auf ...

4 die antwort

Warum sollte EDX 0 sein, bevor der DIV-Befehl verwendet wird? [Duplikat

Diese Frage hat hier bereits eine Antwort: Wenn und warum signieren wir extend und verwenden cdq mit mul / div? [/questions/36464879/when-and-why-do-we-sign-extend-and-use-cdq-with-mul-div] 1 Antwort Ich habe festgestellt, dass EDX einen ...

4 die antwort

Packing BCD to DPD: Wie kann diese amd64-Assembler-Routine verbessert werden?

Ich schreibe eine Routine zum Konvertieren zwischen BCD [https://en.wikipedia.org/wiki/Binary-coded_decimal] (4 Bits pro Dezimalstelle) undDicht gepackte Dezimalzahl (DPD) [https://en.wikipedia.org/wiki/Densely_packed_decimal] (10 Bits pro ...