Opengl es Tegra2上的OpenGL ES 2.0:GLDrawArray/glDrawElements函数中使用了多少个GPU内核?

Opengl es Tegra2上的OpenGL ES 2.0:GLDrawArray/glDrawElements函数中使用了多少个GPU内核?,opengl-es,multicore,gpu,Opengl Es,Multicore,Gpu,当我调用glDrawArrays/glDrawElements时,有人知道要使用多少GPU内核吗 再详细一点来解释我的问题。 处理器Tegra2有4个核心GPU。要工作,请使用libGLESv2.so。 完成所有准备工作后,创建并链接着色器;上传纹理等,我调用DRAW函数开始光栅化并在帧缓冲区中创建图像。 我认为,绘制函数必须使用尽可能多的核心来更快地进行光栅化。 但我找不到任何证实我理论的文件。 OpenGL的描述中只有关于自己级别API的信息,可以理解的是,并没有关于以下级别的任何信息。NV

当我调用glDrawArrays/glDrawElements时,有人知道要使用多少GPU内核吗

再详细一点来解释我的问题。 处理器Tegra2有4个核心GPU。要工作,请使用libGLESv2.so。 完成所有准备工作后,创建并链接着色器;上传纹理等,我调用DRAW函数开始光栅化并在帧缓冲区中创建图像。 我认为,绘制函数必须使用尽可能多的核心来更快地进行光栅化。 但我找不到任何证实我理论的文件。
OpenGL的描述中只有关于自己级别API的信息,可以理解的是,并没有关于以下级别的任何信息。NVIDIA没有说明libGLESv2.so是如何实现的。

如果没有人不想回答,我会自己做:

经过几次尝试,我得到了以下结果: !!请注意,我使用GPU进行数据计算。使用线性数据数组,因此屏幕定义为高度=1,宽度=数组大小。为了便于计算,绘制了wight=数组大小的直线

绘图函数使用尽可能多的核。 但这取决于要抽取多少顶点。 例如:如果绘制线2顶点,则获得一个性能。如果将这条线分为4个或更多顶点的几条小线,性能会更好。 总而言之,正如我假设使用所有内核一样,调用DRAW时必须使用顶点数至少等于GPU内核数的顶点数。在我的例子中,当行在两个子行上划分时,计算速度加快了约20%。下面的划分几乎没有提高性能