Microsoft最新的AgilitySDK添加了工作图以实现完全GPU自治、WaveMatrix和AV1支持1
Microsoft推出了全新的AgilitySDK预览版,增加了对各个GPU供应商的GPUWorkGraphs、WaveMatrix和AV1的支持。
今天,微软发布了最新的AgilitySDK1.711.3预览版,它带来了三个全新功能,包括工作图、波形矩阵和AV1支持。工作图是允许GPU自主工作并解决与一般计算工作负载相关的限制的主要功能之一。EpicGames还将在其虚幻引擎5中使用WorkGraphs,因为Nanite和Lumen等功能已经达到了当前计算着色器范例的极限,而WorkGraphs不仅可以优化它们,还可以在未来解锁各种功能。
【资料图】
一段时间以来,EpicGames一直在寻找和倡导更好的解决方案来解决GPU生成的工作问题。UE5渲染功能(例如Nanite和Lumen)正在触及当前由CPU发出的单独调度链的计算着色器范式的极限。
工作图直接解决了这个问题,它不仅允许我们做以前做不到的事情,而且还使我们能够以更容易编写的方式来做这些事情。我们已经开始探索如何使用工作图来优化当前的功能,并对它们在未来可以释放的可能性感到兴奋。
第一个版本的工作图允许计算着色器请求其他计算着色器异步运行,以执行计算工作的剔除、分级或链接等任务。如果需要,这些工作请求可以包括由系统管理的数据有效负载。
Microsoft最新的AgilitySDK添加了工作图以实现完全GPU自主、WaveMatrix和AV1支持2
硬件可以灵活地高效地安排工作,而开发人员无需了解每个设备的具体情况。与用于GPU工作生成的现有串行ExecuteIndirect模型相比,该编程模型在许多方面更易于使用且更灵活。
在工作图尚未完全替代ExecuteIndirect的情况下(例如启动光栅化器),他们仍然可以根据需要设置ExecuteIndirect缓冲区。随着时间的推移,Microsoft可以将新功能添加到工作图中。AMD关于WorkGraphs的GPUOpen博客文章解释了这项技术可以:
...启用更直接的方法来解决复杂问题。
...减少内存限制并提高缓存利用率。
…简化通道间依赖性和屏障引起的复杂性。
...提高GPU线程饱和度。
波矩阵
GPU和计算设备已开始在其硬件中添加专用芯片,以支持更高带宽的矩阵乘法,以便在机器学习和成像应用中使用。为了允许访问此专用芯片,HLSL在该语言中添加了波矩阵指令,也称为波矩阵乘法累加(WaveMMA)。此添加定义了几个新的抽象WaveMatrix数据类型,它允许底层硬件跨Wave中的所有线程存储、重新排列和复制数据。这是规格。
Microsoft的WaveMatrix驱动程序支持:
AMD:AMD将在未来几周内发布支持WaveMMA的预览版AMD软件:Adrenalin版驱动程序,请在此处观看该驱动程序的更新链接。
英特尔:对于英特尔驱动程序,请联系您的开发人员代表
NVIDIA:对于NVIDIA驱动程序,请联系您的开发者参与代表
高通:计划未来提供支持
AV1编码
AV1是一种新的编解码器,通过提供更高的压缩性能,同时保持与其他可用编解码器相同的质量,正在获得整个行业的采用。
AMDRadeonGPU现在可以在DaVinciResolveStudio1中享受AV1编码支持
近年来,使用AV1编码视频的专用硬件已经问世。通过扩展之前发布的现有D3D12视频编码API,微软能够提供统一的接口来访问AV1视频编码硬件。这是规格。
AV1编码驱动支持:
AMD:AMD软件:Adrenalin版驱动程序支持AMDRadeonRX7000系列图形GPU上的AV1编码,预计将于2023年第四季度推出
英特尔:对于英特尔驱动程序,请联系您的开发人员代表
NVIDIA:RTX40系列GPU,驱动程序版本545.31+
高通:计划未来提供支持