Opengl es Tegra2上的OpenGL ES 2.0：GLDrawArray/glDrawElements函数中使用了多少个GPU内核？_Opengl Es_Multicore_Gpu

Opengl es Tegra2上的OpenGL ES 2.0：GLDrawArray/glDrawElements函数中使用了多少个GPU内核？

opengl-es

Opengl es Tegra2上的OpenGL ES 2.0：GLDrawArray/glDrawElements函数中使用了多少个GPU内核？,opengl-es,multicore,gpu,Opengl Es,Multicore,Gpu,当我调用glDrawArrays/glDrawElements时，有人知道要使用多少GPU内核吗再详细一点来解释我的问题。处理器Tegra2有4个核心GPU。要工作，请使用libGLESv2.so。完成所有准备工作后，创建并链接着色器；上传纹理等，我调用DRAW函数开始光栅化并在帧缓冲区中创建图像。我认为，绘制函数必须使用尽可能多的核心来更快地进行光栅化。但我找不到任何证实我理论的文件。 OpenGL的描述中只有关于自己级别API的信息，可以理解的是，并没有关于以下级别的任何信息。NV

当我调用glDrawArrays/glDrawElements时，有人知道要使用多少GPU内核吗

再详细一点来解释我的问题。处理器Tegra2有4个核心GPU。要工作，请使用libGLESv2.so。完成所有准备工作后，创建并链接着色器；上传纹理等，我调用DRAW函数开始光栅化并在帧缓冲区中创建图像。我认为，绘制函数必须使用尽可能多的核心来更快地进行光栅化。但我找不到任何证实我理论的文件。

OpenGL的描述中只有关于自己级别API的信息，可以理解的是，并没有关于以下级别的任何信息。NVIDIA没有说明libGLESv2.so是如何实现的。

如果没有人不想回答，我会自己做：

经过几次尝试，我得到了以下结果： !!请注意，我使用GPU进行数据计算。使用线性数据数组，因此屏幕定义为高度=1，宽度=数组大小。为了便于计算，绘制了wight=数组大小的直线

绘图函数使用尽可能多的核。但这取决于要抽取多少顶点。例如：如果绘制线2顶点，则获得一个性能。如果将这条线分为4个或更多顶点的几条小线，性能会更好。总而言之，正如我假设使用所有内核一样，调用DRAW时必须使用顶点数至少等于GPU内核数的顶点数。在我的例子中，当行在两个子行上划分时，计算速度加快了约20%。下面的划分几乎没有提高性能