Я немного покопался в том, что на самом деле происходит на аппаратном уровне в GPU, и нашел NVidia Life of the треугольник, который довольно хорошо объясняет конвейер, по крайней мере, для зеленых прямоугольников. Одна вещь, которая мне не ясна, это то, что происходит с индексированными сетками, когда одна и та же вершина используется для группы разных треугольников. Поскольку данные обычно не сохраняются дольше, чем это необходимо в потоковом процессоре, я предполагаю, что вершина просто уничтожается после растеризации, затем извлекается и снова запускается через вершинный шейдер всякий раз, когда она появляется в новом треугольнике. Кто-нибудь может это подтвердить? Кроме того, что происходит в режимах линейной или треугольной полос? Сохраняет ли GPU преобразованные данные вершин где-нибудь до тех пор, пока 2 или 3 соответствующих примитива не будут растеризованы в этих случаях?