C++ 一个常量缓冲区可以用于多个对象吗?
我是Direct3D 11的新手,在理解如何基于每个对象更新常量(和其他缓冲区)时遇到一些困难。我有一些简单的代码,我试图让两个四边形画在屏幕上,但位置不同。这是我用来画它们的代码C++ 一个常量缓冲区可以用于多个对象吗?,c++,directx,directx-11,C++,Directx,Directx 11,我是Direct3D 11的新手,在理解如何基于每个对象更新常量(和其他缓冲区)时遇到一些困难。我有一些简单的代码,我试图让两个四边形画在屏幕上,但位置不同。这是我用来画它们的代码 // ------------------------------------------------------------------------------------------------------------------------------ void QuadShape::UpdateBuffers
// ------------------------------------------------------------------------------------------------------------------------------
void QuadShape::UpdateBuffers(ID3D11DeviceContext* pContext)
{
// We need to know about our verts + set the constant buffers...
// NOTE: We only really need to do this when the buffer data actually changes...
XMMATRIX translate = XMMatrixTranspose(XMMatrixTranslation(X, Y, 0));
XMStoreFloat4x4(&ConstData.World, translate);
D3D11_MAPPED_SUBRESOURCE mappedResource;
ZeroMemory(&mappedResource, sizeof(D3D11_MAPPED_SUBRESOURCE));
pContext->Map(ConstBuf, 0, D3D11_MAP_WRITE_DISCARD, 0, &mappedResource);
memcpy(mappedResource.pData, &ConstData, sizeof(ObjectConstBuffer));
pContext->Unmap(ConstBuf, 0);
}
// ------------------------------------------------------------------------------------------------------------------------------
void QuadShape::Draw(ID3D11DeviceContext* pContext)
{
UpdateBuffers(pContext);
pContext->DrawIndexed(_VertCount, _StartVert, 0);
}
您可以看到,我正在根据对象的当前X/Y位置计算平移矩阵,并将其映射到对象的常量缓冲区,表示为“ConstBuf”。我遇到的问题来自这样一个事实,即所有四边形最终都在同一位置绘制,尽管我已经验证了为每个四边形计算的矩阵确实不同,并且缓冲区确实是动态的
我猜想正在发生的是,映射的资源只是被最后一个矩阵所覆盖,但我认为MAP\u WRITE\u DISCARD应该可以避免这种情况。我很困惑,我如何才能为每个对象使用不同的常量缓冲区,并使它们显示在不同的位置?您需要更新着色器中的常量缓冲区。在
UpdateBuffers
方法的末尾添加:
pContext->VSSetConstantBuffers(0, 1, ConstBuf);
还要确保缓冲区是16字节对齐的:
性能损失可能没有您想象的那么大,特别是与您在每帧基础上执行的其他昂贵操作相比(出于好奇,我将实际测试它并让您知道结果),这是非常标准的操作方式。如果你不想相信我的话,请看一看Frank Luna的这篇文章,这篇文章很好地解释了常量缓冲区,并提供了处理它们的常用策略:
如果您真的担心在每个对象的基础上调用*SetConstantBuffers
(例如,您有许多独立移动的对象),那么您可以每帧绑定一次,然后为每个对象使用指向绑定缓冲区的指针
一种方法是使用着色器
类来封装所有着色器相关资源以及绘制对象,因此在我的主要更新方法中,我会调用着色器::bindBuffers()
一次,然后为每个对象及其参数(包括矩阵)调用着色器::Render(Object*)
。在Shader::Render()
内部,我使用之前绑定的缓冲区,并使用map/unmap等更新它们
另一种方法是让对象像您一样绘制自己,但将一个指向常量缓冲区(存储为调用类的成员)的指针传递给render方法(在您的例子中是soUpdateBuffers
)。您可以在Microsoft提供的此示例中看到类似的方法:
然而,这些都是优化,您通常不应该过早地担心它们。您应该根据更新频率对常量缓冲区进行分组,因此如果您有每个对象更改的一些数据,请将其放在一个常量缓冲区中。如果有其他数据(如投影矩阵)只有在调整窗口大小时才会更改,请将其放入另一个常量缓冲区中 例如,定义两个这样的缓冲区:
struct CBPerObject
{
XMMATRIX mWorld; // world matrix
};
struct CBChangeOnResize
{
XMMATRIX mProjection; // projection matrix
};
然后创建常量缓冲区,并在成员变量中保留对它们的引用:
CComPtr<ID3D11Buffer> m_pCBPerObject; // dx11 constant buffer (per object)
CComPtr<ID3D11Buffer> m_pCBChangeOnResize; // dx11 constant buffer (change on resize)
现在,您可以在初始化期间仅绑定它们一次(假设布局不会更改):
您可能也需要绑定到像素着色器,但请改用PSSetConstantBuffers
现在,您只需要在需要时更新常量缓冲区。例如,调整窗口大小时:
void CMyClass::OnSize()
{
// update projection matrix
CBChangeOnResize cbBuffer;
// calculate the projection matrix - for example:
XMMATRIX mProjection = XMMatrixOrthographicOffCenterLH(fLeft, fRight, fBottom,
fTop, 0.1f, 1000.0f);
cbBuffer.mProjection = XMMatrixTranspose(mProjection);
// update the constant buffer
pContext->UpdateSubresource(m_pCBChangeOnResize, 0, nullptr, &cbBuffer, 0, 0);
}
类似地,绘制时,更新每个对象的世界矩阵:
void CMyClass::DrawScene()
{
// draw the complete scene
CBPerObject cbBuffer;
// ... clear render target etc.
// for each object ...
{
cbBuffer.mWorld = XMLoadFloat4x4(pObject->GetWorld());
// update cb and draw object
pContext->UpdateSubresource(m_pCBPerObject, 0, nullptr, &cbBuffer, 0, 0);
pContext->DrawIndexed(6, 0, 0);
}
// ... etc.
}
因此,除非布局发生更改,否则无需重新绑定常量缓冲区,并且您可以使用UpdateSubresource
而不是Map
/Unmap
,如我上面所示
在顶点(像素)着色器中,根据绑定常量缓冲区的插槽定义常量缓冲区:
cbuffer cbPerObject : register (b0)
{
matrix mWorld;
};
cbuffer cbChangeOnResize : register (b1)
{
matrix mProjection;
};
在语法中:register(b0)
和register(b1)
在这种情况下,b0
和b1
引用提供给VSSetConstantBuffers
的第一个参数,您必须为每个对象“更新绑定绘图”。伪代码:
foreach(object in objects)
{
constantBuffer.update(object.position);
device.bind(constantBuffer);
device.draw();
}
您的代码缺少绑定调用
这样,对于N个对象,您得到了N个缓冲区更新、N个绑定和N个绘制调用,如果您有很多对象(您在驱动程序中花费了很多时间,有CPU-GPU同步点,内存带宽被冗余数据传输占用),则效率会非常低。不过,不必要的绑定调用可以通过适当的驱动程序实现来消除
更新存在几种不同的方法,它们将内存和代码复杂性与运行时性能进行权衡。值得注意的是,有“批处理”和一系列技术,称为“几何体实例”:
一,批处理可以描述为在顶点缓冲区中合并所有对象的预变换顶点,而不是在着色器中变换它们。可以大大节省顶点着色器的时间,但如果对象的任何属性(例如位置)发生更改,则需要在CPU(!)上重新计算对象的所有顶点,并部分更新顶点缓冲区。因此,它最适用于静态对象(例如,不经常/根本不移动)和小对象(没有多少顶点需要更新)。通常用于绘制2D内容:精灵、GUI和文本。
二,硬件几何体实例。您需要额外的顶点缓冲区,它将存储实例属性而不是顶点属性(我们称之为实例缓冲区)。必须更改输入布局,添加每个实例属性。您可以在对象更改其属性时更新实例缓冲区,就像使用任何顶点缓冲区一样。您可以使用
DrawInstanced*()
调用进行绘制。这是一种流行的技术,可以优化许多非常相似的动态对象(草、树叶、陨石、道路交通、足球场上的球迷等)的绘图。有几个高级技巧允许在eve应用它
cbuffer cbPerObject : register (b0)
{
matrix mWorld;
};
cbuffer cbChangeOnResize : register (b1)
{
matrix mProjection;
};
foreach(object in objects)
{
constantBuffer.update(object.position);
device.bind(constantBuffer);
device.draw();
}