通过缓冲区上传纹理数据
上传 2D 或 3D 纹理数据与上传 1D 数据类似,但应用程序需要更密切地关注与行间距相关的数据对齐情况。 可以从图形管道的多个部分正交和同时使用缓冲区,缓冲区非常灵活。
通过缓冲区上传纹理数据
应用程序必须通过 ID3D12GraphicsCommandList::CopyTextureRegion 或 ID3D12GraphicsCommandList::CopyBufferRegion 上传数据。 与其他资源数据相比,纹理数据更有可能变得更大、被重复访问,以及从改进非线性内存布局的缓存一致性中获益。 在 D3D12 中使用缓冲区时,只要满足内存对齐要求,应用程序就可以完全控制与复制周围资源数据相关的数据放置和排列。
该示例突出显示应用程序在将 2D 数据放入缓冲区之前简单地将其平面化为 1D 的位置。 对于 mipmap 2D 场景,应用程序可以离散地将每个子资源平面化并快速使用 1D 二次分配算法,或者使用更复杂的 2D 二次分配方法来最大程度降低视频内存利用率。 第一种方法应会更常用,因为它更简单。 将数据打包到磁盘或跨网络打包数据时,第二种方法可能很有用。 在任一种情况下,应用程序都仍必须对每个子资源调用复制 API。
// Prepare a pBitmap in memory, with bitmapWidth, bitmapHeight, and pixel format of DXGI_FORMAT_B8G8R8A8_UNORM.
//
// Sub-allocate from the buffer for texture data.
//
D3D12_SUBRESOURCE_FOOTPRINT pitchedDesc = { 0 };
pitchedDesc.Format = DXGI_FORMAT_B8G8R8A8_UNORM;
pitchedDesc.Width = bitmapWidth;
pitchedDesc.Height = bitmapHeight;
pitchedDesc.Depth = 1;
pitchedDesc.RowPitch = Align(bitmapWidth * sizeof(DWORD), D3D12_TEXTURE_DATA_PITCH_ALIGNMENT);
//
// Note that the helper function UpdateSubresource in D3DX12.h, and ID3D12Device::GetCopyableFootprints
// can help applications fill out D3D12_SUBRESOURCE_FOOTPRINT and D3D12_PLACED_SUBRESOURCE_FOOTPRINT structures.
//
// Refer to the D3D12 Code example for the previous section "Uploading Different Types of Resources"
// for the code for SuballocateFromBuffer.
//
SuballocateFromBuffer(
pitchedDesc.Height * pitchedDesc.RowPitch,
D3D12_TEXTURE_DATA_PLACEMENT_ALIGNMENT
);
D3D12_PLACED_SUBRESOURCE_FOOTPRINT placedTexture2D = { 0 };
placedTexture2D.Offset = m_pDataCur – m_pDataBegin;
placedTexture2D.Footprint = pitchedDesc;
//
// Copy texture data from DWORD* pBitmap->pixels to the buffer
//
for (UINT y = 0; y < bitmapHeight; y++)
{
UINT8 *pScan = m_pDataBegin + placedTexture2D.Offset + y * pitchedDesc.RowPitch;
memcpy( pScan, &(pBitmap->pixels[y * bitmapWidth]), sizeof(DWORD) * bitmapWidth );
}
//
// Create default texture2D resource.
//
D3D12_RESOURCE_DESC textureDesc { ... };
CComPtr<ID3D12Resource> texture2D;
d3dDevice->CreateCommittedResource(
&CD3DX12_HEAP_PROPERTIES(D3D12_HEAP_TYPE_DEFAULT),
D3D12_HEAP_FLAG_NONE, &textureDesc,
D3D12_RESOURCE_STATE_COPY_DEST,
nullptr,
IID_PPV_ARGS(&texture2D) );
//
// Copy heap data to texture2D.
//
commandList->CopyTextureRegion(
&CD3DX12_TEXTURE_COPY_LOCATION( texture2D, 0 ),
0, 0, 0,
&CD3DX12_TEXTURE_COPY_LOCATION( m_spUploadHeap, placedTexture2D ),
nullptr );
请注意帮助程序结构的用法 CD3DX12_HEAP_PROPERTIES 和 CD3DX12_TEXTURE_COPY_LOCATION,以及 CreateCommittedResource 和 CopyTextureRegion 方法。
复制
D3D12 方法使应用程序能够替换 D3D11 UpdateSubresource、CopySubresourceRegion 以及资源初始数据。 行-主要纹理数据的单个 3D 子资源可能位于缓冲区资源中。 CopyTextureRegion 可以将纹理数据从缓冲区复制到纹理布局未知的纹理资源,反之亦然。 应用程序应优先使用此类方式来填充频繁访问的 GPU 资源,方法是在 UPLOAD 堆中创建大型缓冲区,同时在不具有 CPU 访问权限的 DEFAULT 堆中创建频繁访问的 GPU 资源。 这种方式可有效地支持离散 GPU 及其大量的 CPU 不可访问的存储器,而不会损害 UMA 体系结构。
请注意以下两个常量:
const UINT D3D12_TEXTURE_DATA_PITCH_ALIGNMENT = 256;
const UINT D3D12_TEXTURE_DATA_PLACEMENT_ALIGNMENT = 512;
- D3D12_SUBRESOURCE_FOOTPRINT
- D3D12_PLACED_SUBRESOURCE_FOOTPRINT
- D3D12_TEXTURE_COPY_LOCATION
- D3D12_TEXTURE_COPY_TYPE
- ID3D12Device::GetCopyableFootprints
- ID3D12GraphicsCommandList::CopyResource
- ID3D12GraphicsCommandList::CopyTextureRegion
- ID3D12GraphicsCommandList::CopyBufferRegion
- ID3D12GraphicsCommandList::CopyTiles
- ID3D12CommandQueue::UpdateTileMappings
映射和取消映射
Map 和 Unmap 可由多个线程安全地调用。 首次调用 Map 可为资源分配 CPU 虚拟地址范围。 最后一次调用 Unmap 可取消分配 CPU 虚拟地址范围。 系统通常会向应用程序返回该 CPU 虚拟地址。
当数据通过 Readback 堆中的资源在 CPU 和 GPU 之间传递时,必须使用 Map 和 Unmap 来支持可支持 D3D12 的所有系统。 尽可能紧密地保持范围可最大程度地提高需要范围 (引用 D3D12_RANGE) 的系统的效率。
调试工具的性能不仅受益于在所有 Map / Unmap 调用上准确使用范围,还受益于在不再进行 CPU 修改时取消映射资源的应用程序。
D3D11 方法可使用 Map(使用 DISCARD 参数集)重命名资源,D3D12 不支持此做法。 应用程序必须自己实现资源重命名。 所有 Map 调用都是隐式NO_OVERWRITE和多线程调用。 应用程序复制确保在使用 CPU 访问数据之前完成命令列表中包含的任何相关 GPU 工作。 D3D12 调用 Map 不会隐式刷新任何命令缓冲区,也不会阻止等待 GPU 完成工作。 因此,Map 和 Unmap 甚至可能在某些情况下进行优化。
缓冲区对齐
缓冲区对齐限制:
- 线性子资源复制必须与 512 字节对齐, (行间距与) D3D12_TEXTURE_DATA_PITCH_ALIGNMENT字节对齐。
- 常量数据读取数必须是来自堆起始处的 256 字节的倍数(即仅来自 256 字节对齐的地址)。
- 索引数据读取数必须是索引数据类型大小的倍数(即仅来自与数据自然对齐的地址)。
- ID3D12GraphicsCommandList::ExecuteIndirect 数据必须来自 4 (的倍数的偏移量,即仅来自 DWORD) 对齐的地址。