继上周 Vulkan 规范更新引入描述符堆及其他重要新扩展,并发布《Vulkan 2026路线图里程碑》之后,Vulkan 1.4.342版本于近日发布,作为最新例行规范更新,同时新增一项扩展。
本次更新主要对现有文档进行若干修正与说明,虽无重大改动,但新增了一项扩展:VK_QCOM_cooperative_matrix_conversion。

根据扩展文本,高通厂商扩展 VK_QCOM_cooperative_matrix_conversion 增加了对新的 SPIR-V 着色器指令的支持,允许加载和存储协作矩阵而无需通过共享内存进行分阶段操作,并允许对数组进行位转换。围绕此支持的新 SPIR-V 指令位于 SPV_QCOM_cooperative_matrix_conversion 规范中。对于 GLSL 着色器,GLSL_QCOM_cooperative_matrix_conversion 规范也可用于协作矩阵转换。
高通提出此 VK_QCOM_cooperative_matrix_conversion 扩展的问题陈述描述了他们发现的现有协作矩阵扩展的不足之处:
“基线协作矩阵扩展在数据加载到内存和从内存加载数据时,能够显著提升简单的矩阵乘法运算的性能。
然而,大多数利用矩阵乘法硬件的用例,例如卷积和大型语言模型,都需要对输入和输出数据进行额外的操作,而这些操作是目前不透明的协作矩阵对象所无法直接支持的。协作矩阵扩展需要通过共享内存来暂存数据,才能执行这些调用级别的操作。
因此,我们需要一个扩展,允许实现无需显式地通过共享内存,即可在调用范围和子组范围之间创建优化的数据转换。”
感兴趣的读者可以查看此 Vulkan 文档提交中的更多详细信息。
本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/zixun/64532.html