Welcher Algorithmus ermittelt die optimale Arbeitsgruppengröße und Anzahl der Arbeitsgruppen?
Der OpenCL-Standard definiert die folgenden Optionen, um Informationen über das Gerät und den kompilierten Kernel abzurufen:
CL_DEVICE_MAX_COMPUTE_UNITS
CL_DEVICE_MAX_WORK_GROUP_SIZE
CL_KERNEL_WORK_GROUP_SIZE
CL_KERNEL_PREFERRED_WORK_GROUP_SIZE_MULTIPLE
Wie kann ich angesichts dieser Werte die optimale Größe der Arbeitsgruppe und die Anzahl der Arbeitsgruppen berechnen?