驻留
如果 GPU 可访问某个对象,则该对象将被视为常驻对象。
驻留预算
GPU 尚不支持分页错误,因此,当 GPU 可以访问数据时,应用程序必须将数据提交到物理内存。 此过程称为“使内容常驻”,必须针对物理系统内存和物理离散的视频内存执行。 在 D3D12 中,大多数 API 对象封装一定数量的 GPU 可访问内存。 在创建 API 对象期间,该 GPU 可访问内存被设置为常驻,在销毁 API 对象时将被逐出。
可供该进程使用的物理内存量称为视频内存预算。 该预算可能会随着后台进程的唤醒和睡眠而有明显的波动;当用户切换到另一应用程序时,这种波动会很大。 应用程序在预算更改时可以收到通知,并可以轮询当前预算以及当前已消耗的内存量。 如果应用程序不在预算范围内,该进程将会间歇性地冻结以使其他应用程序能够运行,并且/或者创建 API 将返回失败。 IDXGIAdapter3 接口提供与此功能相关的方法,具体而言,是 QueryVideoMemoryInfo 和 RegisterVideoMemoryBudgetChangeNotificationEvent。
建议应用程序使用预留来指示它们必须获得的内存量。 理想情况下,用户指定的“低”图形设置甚至更低的设置是此类预留的适当值。 设置预留不会使应用程序的预算高于它在正常情况下获得的预算。 相反,预留信息可帮助 OS 内核快速最小化较大内存压力造成的影响。 即使应用程序不是前台应用程序,也不保证预留可供该应用程序使用。
堆资源
虽然许多 API 对象封装了一些 GPU 可访问的内存,但堆 & 资源应该是应用程序使用和管理物理内存的最重要方式。 堆是用于管理物理内存的最低级单元,因此,最好对其驻留属性有一定的了解。
- 无法将堆指定为部分常驻,但对于保留的资源有解决方法可用。
- 应该将堆的预算计划为特定池的一部分。 UMA 适配器有一个池,而离散的适配器有两个池。 尽管内核确实可将离散适配器中的某些堆从视频内存转移到系统内存,则它只会在迫不得已的情况下才这样做。 应用程序不应依赖于内核的超预算行为,而应该注重良好的预算管理。
- 可以从驻留位置逐出堆,使其内容可以分页到磁盘。 但是,堆销毁是一种更可靠的技术,它可以释放所有适配器体系结构中的驻留位置。 在D3D12_FEATURE_DATA_GPU_VIRTUAL_ADDRESS_SUPPORT的MaxGPUVirtualAddressBitsPerProcess字段接近预算大小的适配器上,Evict 无法可靠地回收驻留。
- 堆创建操作可能很缓慢;但它已针对后台线程处理进行优化。 建议在后台线程中创建堆,以避免干扰渲染线程。 在 D3D12 中,多个线程可以安全地同时调用创建例程。
D3D12 在其资源模型中引入了更大的灵活性和正交性,使应用程序支持更多的选项。 D3D12 中的资源有三个高级类型:已提交、已定位和已保留。
- 已提交资源同时创建资源和堆。 堆是隐式的,不可直接访问。 堆的大小适当,可在其中放置整个资源。
- 已定位资源允许将资源放在堆中的非零偏移位置。 偏移量通常必须经过 64KB 对齐;但两个方向存在某些例外情况。 MSAA 资源需要 4MB 偏移对齐,对于小纹理可以使用 4KB 偏移对齐。 已定位资源不能直接重新定位或重新映射到另一个堆;但是,使用它们可在堆之间方便地重新定位资源数据。 在不同的堆中创建新的已定位资源并复制资源数据后,必须对新的资源数据位置使用新的资源描述符。
- 仅当适配器支持图块式资源层 1 或更高的层时,已保留资源才可用。 如果可用,它们会提供可用的最先进驻留管理技术;但目前并非所有适配器都支持这些技术。 它们支持重新映射资源,而无需重新生成资源描述符、部分 mip 级别驻留和稀疏纹理方案等。即使保留的资源可用,也并非所有资源类型都受支持,因此完全基于页面的驻留管理器尚不可行。
驻留优先级
当内存压力要求将一部分资源降级时,开发人员可以使用 Windows 10 创意者更新来判断最好是将哪些堆和资源保持常驻。 这样可以帮助开发人员通过利用运行时无法从 API 的使用推断的知识来创建性能更好的应用程序。 当开发人员从已提交资源改用已保留资源和图块式资源后,有望能够更轻松且更合理地指定优先级。
应用这些优先级必定比管理两个动态内存预算,并在它们之间手动降级和升级资源更轻松,因为应用程序已经可以执行此操作。 因此,驻留优先级 API 设计的粒度级不高,但会在创建每个堆或资源时为其分配合理的默认优先级。 有关详细信息,请参阅 ID3D12Device1::SetResidencyPriority 和 D3D12_RESIDENCY_PRIORITY 枚举。
使用优先级预期可让开发人员:
- 提高几个例外堆的优先级,以更好地缓解比以其自然访问模式需求更高的速度或频率降级的堆造成的性能影响。 从 Direct3D 11 或 OpenGL 等图形 API(其资源管理模型明显不同于 Direct3D 12)移植的应用程序预期会利用此方法。
- 以固定方式、根据程序员对访问频率的了解或以动态方式将几乎所有的堆优先级覆盖为应用程序自身的桶化方案;固定方案的管理比动态方案更容易,但可能更低效,且在开发过程中当使用模式发生变化时需要程序员的干预。 设计时考虑到了 Direct3D 12 式资源管理的应用程序预期会利用此方法,例如使用驻留库(尤其是动态方案)的应用程序。
默认优先级算法
在不事先了解默认优先级算法的情况下,应用程序无法为它尝试管理的任何堆指定有用的优先级。 这是因为,分配给堆的特定优化级值派生自争用同一内存的其他优先堆的相对优先级。
为生成默认优先级而选择的策略是将堆分类成两个桶,并优先使用(分配更高的优先级)GPU 频繁写入的堆(相比其他堆)。
高优先级桶包含使用标志创建的堆和资源。标志将这些堆和资源标识为渲染器目标、深度模具缓冲区或无序访问视图 (UAV)。 这些值在 从 D3D12_RESIDENCY_PRIORITY_HIGH 开始的范围内分配优先级值;为了进一步确定这些堆和资源之间的优先级,优先级的最低 16 位设置为堆或资源的大小除以 10MB (饱和,以0xFFFF极大型堆) 。 这种额外的优先级非常适合较大型堆和资源。
低优先级存储桶包含所有其他堆和资源,这些堆和资源分配的优先级值为 D3D12_RESIDENCY_PRIORITY_NORMAL。 系统不会尝试在这些堆和资源中进一步指定优先级。
编程驻留管理
只需创建已提交资源,直到出现内存不足错误,即可创建简单的应用程序。 失败时,应用程序可能销毁其他已提交的资源或 API 对象,使后续的资源创建能够成功。 但是,即使是对于简单应用程序,我们也强烈建议监视负面的预算更改,并在大约处理一帧后销毁未使用的 API 对象。
如果尝试针对适配器体系结构进行优化或整合驻留优先级,驻留管理设计的复杂性将会增大。 离散预算和管理两个离散内存池比只管理一个池要复杂得多,如果使用模式演变,大规模分配固定优先级可能会成为维护负担。 将纹理溢出到系统内存会进一步增大复杂性,因为系统内存中的错误资源可能会严重影响帧速率。 此外,没有任何简单的功能可帮助识别能够受益于更高 GPU 带宽或容忍更低 GPU 带宽的资源。
更复杂的设计需要查询当前适配器的功能。 此信息在 D3D12_FEATURE_DATA_GPU_VIRTUAL_ADDRESS_SUPPORT、 D3D12_FEATURE_DATA_ARCHITECTURE、 D3D12_TILED_RESOURCES_TIER 和 D3D12_RESOURCE_HEAP_TIER 中提供。
应用程序的多个组成部分最终可能会使用不同的技术。 例如,某些大型纹理和极少执行的代码路径可能使用已提交资源,而许多纹理中可能指定了流属性,因此会使用常规的已定位资源技术。
相关主题