摩尔线程全功能GPU实现HTJ2K高性能编解码，加速电影技术自主化

近期，中国电影科学技术研究所在《现代电影技术》期刊发表了题为《基于HTJ2K算法和国产GPU实现的数字电影图像编解码技术研究》的论文。该研究基于摩尔线程全功能GPU及MUSA架构，成功实现了HTJ2K图像编解码的高效处理。该成果为国产数字电影设备提供了高效率的图像编解码解决方案，有助于打破国外技术垄断，推动国产LED 显示与4K/8K标准的自主发展，对实现中国电影行业全链路技术自主可控具有重要应用价值。

电影行业为什么亟需HTJ2K技术？

当前，图像数据的产生和传输呈爆发式增长，无论是在医学影像、卫星遥感图像，还是在高清视频监控、数字图书馆等领域，都需采用高效的图像压缩技术，以减少数据存储和传输成本。JPEG 2000（J2K）凭借其优越的压缩性能，被广泛应用于诸多领域。然而，由于J2K算法计算复杂度较高，难以满足高吞吐量的要求。2019年，联合图像专家组（JPEG）推出了高吞吐量JPEG 2000（High‐Throughput JPEG 2000，HTJ2K）压缩技术，以略微降低编码效率为代价，将J2K的解码速度提高至少10倍。HTJ2K是JPEG2000标准的第15部分（Rec.ITU-T T.814 | ISO/IEC15444-15），其不仅保留了J2K原有的功能和特点，而且比传统J2K更快、更高效。

随着高帧率、高动态范围、广色域等技术在电影中的综合应用，电影图像编解码面临数据量的几何级增长与编解码复杂度大幅提升的双重挑战，对数据存储与网络传输带宽造成巨大压力。同时，为处理更精细的画面信息，编解码器在帧内预测、运动补偿等环节需执行更复杂的算法，显著提高了计算需求与处理时间。

为适应电影高新技术格式的发展趋势，电影行业亟需新一代高效图像编解码技术，以实现海量电影数据的高效处理。对观众而言，HTJ2K意味着更优质的画质呈现；对行业而言，它是提升效率与优化成本的关键技术。

HTJ2K具备以下突出优势：

极速性能：在相同硬件条件下，HTJ2K解码速度较传统J2K提升5~30倍，且输入码流越大，速率提升越显著。
更高画质：它支持高分辨率（8K）、高帧率（HFR）及高动态范围（HDR），有效应对高新技术格式电影带来的海量数据处理挑战。
无损兼容：与现有电影工作流程兼容，支持与J2K图像内容之间的双向无损转换，在保障电影资产数据完整性与互操作性的同时，大幅降低计算负载与能耗。
自主可控：作为J2K国际标准系列的一员，HTJ2K无需支付专利费用，降低了技术应用门槛，有利于国产技术及设备的自主研发，推动相关领域实现技术自主可控。

异构协同架构与并行算法优化

为充分发挥摩尔线程全功能GPU的并行计算潜力，研究团队采用软硬件协同设计，对方案进行了深度优化。研究采用摩尔线程训推一体全功能智算卡MTT S4000，其MUSA软件栈提供了丰富的编程接口与工具，并兼容国际主流生态，可大幅降低开发者的迁移与学习成本，便于快速利用GPU的大规模并行处理能力。

该技术方案采用了分工明确的异构协同计算架构，充分结合CPU与GPU优势：CPU负责用户交互、任务调度及数据预处理等逻辑任务，GPU则承担图像编解码的核心计算任务。在并行算法设计上，通过分块并行处理、严格遵循DCI规范，将代码块设置为32×32，利用 GPU线程束（Warp）执行大规模并行计算。同时，采用创新的条带划分独立编解码策略，结合共享内存优化机制，有效减少全局内存访问，确保各计算核心负载均衡的流水线并行，从而充分发挥摩尔线程全功能GPU的并行计算效能。

性能实测：全功能GPU展现显著优势

测试平台搭载摩尔线程训推一体全功能智算卡MTT S4000，搭配32核Intel® Xeon® Gold 6430 处理器，运行Ubuntu 22.04操作系统。在该平台上部署中国电影科学技术研究所开发的HTJ2K编解码控制软件，该软件可与开源OpenJPH实现编解码文件的互操作验证。功能测试结果表明，该技术方案完全符合HTJ2K算法标准。