Suchergebnisse für Anfrage "intel"

2 die antwort

x86_64: ist IMUL schneller als 2x SHL + 2x ADD?

Beim Betrachten der von Visual Studio (2015U2) in @ erstellten Assemb/O2 (release) mode Ich habe gesehen, dass dieses 'handoptimierte' Stück C-Code wieder in eine Multiplikation übersetzt wird: int64_t calc(int64_t a) { return (a << 6) + (a << ...

2 die antwort

Wo ist VPERMB in AVX2?

AVX2 hat viele gute Sachen. Zum Beispiel enthält es viele Anweisungen, die strikt mächtiger sind als ihre Vorgänger. NehmenVPERMD [http://www.felixcloutier.com/x86/VPERMD.html]: Ermöglicht das beliebige Senden / Mischen / Permutieren von einem ...

2 die antwort

Alignment und SSE seltsames Verhalten

Ich versuche, mit SSE zu arbeiten, und habe mich mit einem merkwürdigen Verhalten konfrontiert. Ich schreibe einfachen Code zum Vergleichen zweier Zeichenfolgen mit SSE Intrinsics, führe ihn aus und es funktioniert. Aber später verstehe ich, ...

TOP-Veröffentlichungen

4 die antwort

Warum ist Skylake für den Single-Threaded-Speicherdurchsatz so viel besser als Broadwell-E?

Wir haben einen einfachen Benchmark für den Speicherdurchsatz. Es wird lediglich wiederholt für einen großen Speicherblock gespeichert. Betrachtet man die Ergebnisse (für 64-Bit-Versionen kompiliert) auf einigen verschiedenen Computern, sind ...

2 die antwort

Ist eine Intel-basierte Grafikkarte mit Tensorflow / GPU kompatibel?

Ist diese Grafikkarte mit Tensorflow / GPU kompatibel? *-display description: VGA compatible controller product: Haswell-ULT Integrated Graphics Controller vendor: Intel Corporation physical id: 2 bus info: pci@0000:00:02.0 version: 09 width: 64 ...

2 die antwort

Intel Intrinsics-Handbuch - Latenz und Durchsatz

Kann jemand die in @ angegebenen Werte für Latenz und Durchsatz erkläreIntel Intrinsic Guide [https://software.intel.com/sites/landingpage/IntrinsicsGuide/#] ? Habe ich es richtig verstanden, dass die Latenz die Anzahl der Zeiteinheiten ist, die ...

2 die antwort

GCC kompiliert die Anzahl der führenden Nullen nur schlecht, wenn Haswell @ angegeben ha

GCC unterstützt das__builtin_clz(int x) [https://gcc.gnu.org/onlinedocs/gcc-6.2.0/gcc/Other-Builtins.html#index-g_t_005f_005fbuiltin_005fclz-4249] builtin, das die Anzahl von @ zähführende Nulle (aufeinanderfolgende höchstwertige Nullen) im ...