Suchergebnisse für Anfrage "intel"

GCC unterstützt das__builtin_clz(int x) [https://gcc.gnu.org/onlinedocs/gcc-6.2.0/gcc/Other-Builtins.html#index-g_t_005f_005fbuiltin_005fclz-4249] builtin, das die Anzahl von @ zähführende Nulle (aufeinanderfolgende höchstwertige Nullen) im ...

performance sse intrinsics x86

2 die antwort

Intel Intrinsics-Handbuch - Latenz und Durchsatz

Kann jemand die in @ angegebenen Werte für Latenz und Durchsatz erkläreIntel Intrinsic Guide [https://software.intel.com/sites/landingpage/IntrinsicsGuide/#] ? Habe ich es richtig verstanden, dass die Latenz die Anzahl der Zeiteinheiten ist, die ...

tensorflow graphic gpu

2 die antwort

Ist eine Intel-basierte Grafikkarte mit Tensorflow / GPU kompatibel?

Ist diese Grafikkarte mit Tensorflow / GPU kompatibel? *-display description: VGA compatible controller product: Haswell-ULT Integrated Graphics Controller vendor: Intel Corporation physical id: 2 bus info: pci@0000:00:02.0 version: 09 width: 64 ...

TOP-Veröffentlichungen

The In-Depth Guide on Video Streaming Protocols [for non-tech founders]

Wie erstellt man eine Krypto-Tauschbörse?

x86 benchmarking cpu-architecture performance

4 die antwort

Warum ist Skylake für den Single-Threaded-Speicherdurchsatz so viel besser als Broadwell-E?

Wir haben einen einfachen Benchmark für den Speicherdurchsatz. Es wird lediglich wiederholt für einen großen Speicherblock gespeichert. Betrachtet man die Ergebnisse (für 64-Bit-Versionen kompiliert) auf einigen verschiedenen Computern, sind ...

sse c simd c++

2 die antwort

Alignment und SSE seltsames Verhalten

Ich versuche, mit SSE zu arbeiten, und habe mich mit einem merkwürdigen Verhalten konfrontiert. Ich schreibe einfachen Code zum Vergleichen zweier Zeichenfolgen mit SSE Intrinsics, führe ihn aus und es funktioniert. Aber später verstehe ich, ...

assembly sse x86 avx2

2 die antwort

Wo ist VPERMB in AVX2?

AVX2 hat viele gute Sachen. Zum Beispiel enthält es viele Anweisungen, die strikt mächtiger sind als ihre Vorgänger. NehmenVPERMD [http://www.felixcloutier.com/x86/VPERMD.html]: Ermöglicht das beliebige Senden / Mischen / Permutieren von einem ...

assembly multiplication x86-64 performance

2 die antwort

x86_64: ist IMUL schneller als 2x SHL + 2x ADD?

Beim Betrachten der von Visual Studio (2015U2) in @ erstellten Assemb/O2 (release) mode Ich habe gesehen, dass dieses 'handoptimierte' Stück C-Code wieder in eine Multiplikation übersetzt wird: int64_t calc(int64_t a) { return (a << 6) + (a << ...

cpu-architecture optimization x86 c++

8 die antwort

Deoptimizing a program for the pipeline in Intel Sandybridge-family CPU

Ich habe mir seit einer Woche den Kopf zerbrochen, um diese Aufgabe zu erfüllen, und ich hoffe, dass mich jemand hier auf den richtigen Weg führen kann. Lassen Sie mich mit den Anweisungen des Lehrers beginnen: Ihre Aufgabe ist das Gegenteil ...

docker arm dockerfile raspberry-pi

2 die antwort

Build Docker-Image für ARM-Architektur auf Intel-Computern (Mac)

Ich möchte von meinem Mac aus ein Docker-Image für ARM erstellen können. Ich weiß, dass ich mit QEMU ARM-Container auf meinem Mac ausführen kann, aber ich kann nicht herausfinden, wie man für ARM erstellt.

x86-64 x86 fma

4 die antwort

FMA Befehl _mm256_fmadd_pd (): "132", "231" und "213"?

Kann mir jemand erklären, warum es 3 Varianten des zusammengesetzten Multiplikations-Akkumulations-Befehls gibt:vfmadd132pd, vfmadd231pd undvfmadd213pd, während es nur ein C intrinsics @ gi_mm256_fmadd_pd? Um die Dinge zu vereinfachen, was ist ...

Seite 1 von 7

12 3 4 5

Suchergebnisse für Anfrage "intel"

GCC kompiliert die Anzahl der führenden Nullen nur schlecht, wenn Haswell @ angegeben ha

Intel Intrinsics-Handbuch - Latenz und Durchsatz

Ist eine Intel-basierte Grafikkarte mit Tensorflow / GPU kompatibel?

Beliebte Schlagwörter

TOP-Veröffentlichungen

Warum ist Skylake für den Single-Threaded-Speicherdurchsatz so viel besser als Broadwell-E?

Alignment und SSE seltsames Verhalten

Wo ist VPERMB in AVX2?

x86_64: ist IMUL schneller als 2x SHL + 2x ADD?

Deoptimizing a program for the pipeline in Intel Sandybridge-family CPU

Build Docker-Image für ARM-Architektur auf Intel-Computern (Mac)

FMA Befehl _mm256_fmadd_pd (): "132", "231" und "213"?

Du bist sehr aktiv! Es ist großartig!

Suchergebnisse für Anfrage "intel"

Beliebte Schlagwörter

TOP-Veröffentlichungen