Достигнуто количество кадров, которые драйверу разрешено буферизовать, и приложение ожидает на графическом процессоре для обработки одного из них. Это обычно будет отображаться как большая часть блокирования времени при первом вызове отрисовки в кадре или при наличии в конце предыдущего кадра.

данные о текстуре, вершине и шейдере уже находятся на видеокарте, вам не нужно отправлять много данных на карту. есть несколько байтов для идентификации данных, и предположительно матрица 4x4, и некоторые другие параметры.

так откуда все эти накладные расходы? операции требуют рукопожатия с GPU?

почему отправка одного меша, содержащего несколько маленьких моделей, рассчитанных на ЦП, часто происходит быстрее, чем отправка идентификатора вершины и матриц преобразования? (второй вариант выглядит так, что должно быть отправлено меньше данных, если только модели не меньше матрицы 4х4)

Ответы на вопрос(3)

Ваш ответ на вопрос