C GLVertexAttribute指针、交错元素和性能/缓存友好性_C_Performance_Caching_Opengl_Gpu

C GLVertexAttribute指针、交错元素和性能/缓存友好性

c performance caching opengl

C GLVertexAttribute指针、交错元素和性能/缓存友好性,c,performance,caching,opengl,gpu,C,Performance,Caching,Opengl,Gpu,因此，在为我正在处理的3D场景编写模型加载器的过程中，我决定将顶点、纹理和法线数据打包如下： VVVVTTTNNN 对于每个顶点，其中V=顶点坐标，T=UV坐标，N=法线坐标。当我将此数据传递到场景的顶点着色器时，我会进行三次GLVertexAttributePointer调用，如下所示： glVertexAttribPointer(ATTRIB_VERTEX, 4, GL_FLOAT, 0, 10, group->vertices.data); glEnableVertexAttrib

因此，在为我正在处理的3D场景编写模型加载器的过程中，我决定将顶点、纹理和法线数据打包如下：

VVVVTTTNNN

对于每个顶点，其中V=顶点坐标，T=UV坐标，N=法线坐标。当我将此数据传递到场景的顶点着色器时，我会进行三次GLVertexAttributePointer调用，如下所示：

glVertexAttribPointer(ATTRIB_VERTEX, 4, GL_FLOAT, 0, 10, group->vertices.data);
glEnableVertexAttribArray(ATTRIB_VERTEX);

glVertexAttribPointer(ATTRIB_NORMAL, 3, GL_FLOAT, 0, 10, group->normals.data);
glEnableVertexAttribArray(ATTRIB_NORMAL);

glVertexAttribPointer(ATTRIB_UV_COORDINATES, 3, GL_FLOAT, 0, 10, group->uvcoordinates.data);
glEnableVertexAttribArray(ATTRIB_UV_COORDINATES);

传递的每个组指针都指向共享顶点数据块中该顶点类型开始的起始位置：

group->vertices.data == data
group->uvcoordinates.data == &data[4]
group->normals.data == &data[7]

我交错这些数据的部分原因是为了对缓存友好性进行编程，并尽量减少发送到卡的数据。（注意：这不是一个现实的性能瓶颈。我正在研究优化，因为我想了解更多关于编程的知识，以解决这些问题。）然而，就我的一生而言，我无法想象GL如何能够推断出3个不同的指针指的是同一个较大数据块中的偏移位置，从而进行必要的优化，以避免在复制数据后再复制数据。此外，由于我只确保数据在系统内存中的局部性（并且对数据在GPU上的组织方式没有任何保证），因此我只针对在GL之外访问这些顶点的情况进行了优化。是这样吗？这些优化大多是无用的，还是以这种方式提供数据有助于最大限度地减少到GPU的数据传输/在顶点着色器中迭代顶点数据时防止缓存未命中？

OpenGL只是一个API，智能在于驱动程序。无论如何，这个问题实际上相当容易实现：对于每个顶点属性，您都有一个起始内存地址，当调用GLDrawArray或glDrawElements时，您会查找找到的最大索引。它定义了范围的上限

然后对顶点属性起始地址进行排序，并针对每个地址检查其范围是否与任何其他顶点属性范围重叠。找到相邻区域并复制它们

对于顶点缓冲区对象，它甚至更简单，因为您已经将内容复制到OpenGL以备处理。

没错，甚至没有考虑对地址进行排序。是的，绝对是关于：VBO——只是好奇不同的方法。谢谢