Vulkan 1.4.352 引入了 VK_NV_cooperative_matrix_decode_vector 函数

Vulkan 1.4.352 于上周五发布,这是 Khronos API 的最新小版本更新。除了少数修复和澄清之外,此次更新还新增了一个扩展,即 NVIDIA 为协作矩阵解码向量支持而开发的扩展。

VK_NV_cooperative_matrix_decode_vector 是 NVIDIA 开发的新扩展,用于扩展之前在 VK_NV_cooperative_matrix2 中添加的解码回调函数,使其支持每次调用解码多个矩阵元素。由于大多数量化权重格式都是分组解包的,因此能够一次性解包多个元素,而不是像以前那样每个元素都调用一次解码函数,效率更高,也更容易进行优化。

总而言之,这是 NVIDIA 对 Vulkan 中协作矩阵支持的一次显著改进,有助于 Vulkan API 实现机器学习目标。

Vulkan 1.4.352 引入了 VK_NV_cooperative_matrix_decode_vector 函数

VK_NV_cooperative_matrix_decode_vector 的引入是 Vulkan 1.4.352规范更新的主要亮点。

NVIDIA 已发布了适用于 Windows 和 Linux 的全新Vulkan 测试版驱动程序,该驱动程序支持这一新的协作矩阵解码向量扩展。Windows 版本的测试版驱动程序版本为 596.54,Linux 版本的测试版驱动程序版本为 595.44.08。

本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/zixun/66741.html

(0)

相关推荐