Возможна ли своевременная (jit) компиляция ядра CUDA?
Поддерживает ли CUDA JIT-компиляцию ядра CUDA?
Я знаю, что OpenCL предлагает эту функцию.
У меня есть некоторые переменные, которые не меняются во время выполнения (т.е. зависят только от входного файла), поэтому я хотел бы определить эти значения с помощью макроса во время компиляции ядра (т.е. во время выполнения).
Если я определю эти значения вручную во время компиляции, использование моего регистра упадет с 53 до 46, что значительно повышает производительность.