Suchergebnisse für Anfrage "intel"

2 die antwort

GCC kompiliert die Anzahl der führenden Nullen nur schlecht, wenn Haswell @ angegeben ha

GCC unterstützt das__builtin_clz(int x) [https://gcc.gnu.org/onlinedocs/gcc-6.2.0/gcc/Other-Builtins.html#index-g_t_005f_005fbuiltin_005fclz-4249] builtin, das die Anzahl von @ zähführende Nulle (aufeinanderfolgende höchstwertige Nullen) im ...

4 die antwort

Mikrofusions- und Adressierungsmodi

Ich habe mit dem @ etwas Unerwartetes gefund Intel® Architecture Code Analyzer [https://software.intel.com/en-us/articles/intel-architecture-code-analyzer] (IACA). Die folgende Anweisung mit[base+index] Adressierung addps xmm1, xmmword ptr ...

1 die antwort

gnu assembler: Adresse von Label / Variable abrufen [INTEL SYNTAX]

Ich habe einen Code wie diesen:

TOP-Veröffentlichungen

2 die antwort

Wo ist VPERMB in AVX2?

AVX2 hat viele gute Sachen. Zum Beispiel enthält es viele Anweisungen, die strikt mächtiger sind als ihre Vorgänger. NehmenVPERMD [http://www.felixcloutier.com/x86/VPERMD.html]: Ermöglicht das beliebige Senden / Mischen / Permutieren von einem ...

4 die antwort

Haxm hängt Emulator auf OSX

2 die antwort

Wie man 4 parallel arbeitet mit PARFOR mit einem Core i3 in Matlab

Ich habe Matlab R2012b für Ubuntu 64-Bit. Ich habe eine Intel Core i3 CPU M 330 mit 2,13 GHz × 4.Ich möchte benutzenparfor 4 Schleifen gleichzeitig paralleli...

2 die antwort

x86_64: ist IMUL schneller als 2x SHL + 2x ADD?

Beim Betrachten der von Visual Studio (2015U2) in @ erstellten Assemb/O2 (release) mode Ich habe gesehen, dass dieses 'handoptimierte' Stück C-Code wieder in eine Multiplikation übersetzt wird: int64_t calc(int64_t a) { return (a << 6) + (a << ...

1 die antwort

Fehler CL_DEVICE_NOT_AVAILABLE beim Aufrufen von clCreateContext (Intel Core2Duo, Intel OCL SDK 3.0 Beta)

Ich versuche, mit OpenCL (Intel opencl-1.2-3.0.56860) zu beginnen. Ich habe es geschafft, das OpenCL SDK von Intel unter Ubuntu 12.05 zu installieren (unter ...

4 die antwort

FMA Befehl _mm256_fmadd_pd (): "132", "231" und "213"?

Kann mir jemand erklären, warum es 3 Varianten des zusammengesetzten Multiplikations-Akkumulations-Befehls gibt:vfmadd132pd, vfmadd231pd undvfmadd213pd, während es nur ein C intrinsics @ gi_mm256_fmadd_pd? Um die Dinge zu vereinfachen, was ist ...

1 die antwort

Umgehen Sie Verzögerungen beim Wechseln der Domänen der Ausführungseinheit