Número de unidades de computação correspondentes ao número de grupos de trabalho

Preciso de alguns esclarecimentos. Estou desenvolvendo o OpenCL no meu laptop executando uma pequena GPU nvidia (310M). Quando eu consulto o dispositivoCL_DEVICE_MAX_COMPUTE_UNITS, o resultado é 2. Li que o número de grupos de trabalho para executar um kernel deve corresponder ao número de unidades de computação Computação heterogênea com OpenCL, Capítulo 9, p. 186), caso contrário, perderia muita largura de banda de memória globa

Além disso, o chip é especificado para ter 16 núcleos cuda (que correspondem aos PEs, acredito). Isso significa que, teoricamente, a configuração com melhor desempenho para essa gpu, em relação à largura de banda da memória global, é ter dois grupos de trabalho com 16 itens de trabalho cad

questionAnswers(4)

yourAnswerToTheQuestion