摩尔线程全功能GPU实现HTJ2K高性能编解码,加速电影技术自主化

近期,中国电影科学技术研究所在《现代电影技术》期刊发表了题为《基于HTJ2K算法和国产GPU实现的数字电影图像编解码技术研究》的论文。该研究基于摩尔线程全功能GPU及MUSA架构,成功实现了HTJ2K图像编解码的高效处理。该成果为国产数字电影设备提供了高效率的图像编解码解决方案,有助于打破国外技术垄断,推动国产LED 显示与4K/8K标准的自主发展,对实现中国电影行业全链路技术自主可控具有重要应用价值。

电影行业为什么亟需HTJ2K技术?

当前,图像数据的产生和传输呈爆发式增长,无论是在医学影像、卫星遥感图像,还是在高清视频监控、数字图书馆等领域,都需采用高效的图像压缩技术,以减少数据存储和传输成本。JPEG 2000(J2K)凭借其优越的压缩性能,被广泛应用于诸多领域。然而,由于J2K算法计算复杂度较高,难以满足高吞吐量的要求。2019年,联合图像专家组(JPEG)推出了高吞吐量JPEG 2000(High‐Throughput JPEG 2000,HTJ2K)压缩技术,以略微降低编码效率为代价,将J2K的解码速度提高至少10倍。HTJ2K是JPEG2000标准的第15部分(Rec.ITU-T T.814 | ISO/IEC15444-15),其不仅保留了J2K原有的功能和特点,而且比传统J2K更快、更高效。

摩尔线程全功能GPU实现HTJ2K高性能编解码,加速电影技术自主化

随着高帧率、高动态范围、广色域等技术在电影中的综合应用,电影图像编解码面临数据量的几何级增长与编解码复杂度大幅提升的双重挑战,对数据存储与网络传输带宽造成巨大压力。同时,为处理更精细的画面信息,编解码器在帧内预测、运动补偿等环节需执行更复杂的算法,显著提高了计算需求与处理时间。

为适应电影高新技术格式的发展趋势,电影行业亟需新一代高效图像编解码技术,以实现海量电影数据的高效处理。对观众而言,HTJ2K意味着更优质的画质呈现;对行业而言,它是提升效率与优化成本的关键技术。

HTJ2K具备以下突出优势:

  • 极速性能:在相同硬件条件下,HTJ2K解码速度较传统J2K提升5~30倍,且输入码流越大,速率提升越显著。
  • 更高画质:它支持高分辨率(8K)、高帧率(HFR)及高动态范围(HDR),有效应对高新技术格式电影带来的海量数据处理挑战。
  • 无损兼容:与现有电影工作流程兼容,支持与J2K图像内容之间的双向无损转换,在保障电影资产数据完整性与互操作性的同时,大幅降低计算负载与能耗。
  • 自主可控:作为J2K国际标准系列的一员,HTJ2K无需支付专利费用,降低了技术应用门槛,有利于国产技术及设备的自主研发,推动相关领域实现技术自主可控。

异构协同架构与并行算法优化

为充分发挥摩尔线程全功能GPU的并行计算潜力,研究团队采用软硬件协同设计,对方案进行了深度优化。研究采用摩尔线程训推一体全功能智算卡MTT S4000,其MUSA软件栈提供了丰富的编程接口与工具,并兼容国际主流生态,可大幅降低开发者的迁移与学习成本,便于快速利用GPU的大规模并行处理能力。

摩尔线程全功能GPU实现HTJ2K高性能编解码,加速电影技术自主化
异构协同计算架构。*上图来自《基于HTJ2K算法和国产GPU实现的数字电影图像编解码技术研究》

该技术方案采用了分工明确的异构协同计算架构,充分结合CPU与GPU优势:CPU负责用户交互、任务调度及数据预处理等逻辑任务,GPU则承担图像编解码的核心计算任务。在并行算法设计上,通过分块并行处理、严格遵循DCI规范,将代码块设置为32×32,利用 GPU线程束(Warp)执行大规模并行计算。同时,采用创新的条带划分独立编解码策略,结合共享内存优化机制,有效减少全局内存访问,确保各计算核心负载均衡的流水线并行,从而充分发挥摩尔线程全功能GPU的并行计算效能。

性能实测:全功能GPU展现显著优势

测试平台搭载摩尔线程训推一体全功能智算卡MTT S4000,搭配32核Intel® Xeon® Gold 6430 处理器,运行Ubuntu 22.04操作系统。在该平台上部署中国电影科学技术研究所开发的HTJ2K编解码控制软件,该软件可与开源OpenJPH实现编解码文件的互操作验证。功能测试结果表明,该技术方案完全符合HTJ2K算法标准。

摩尔线程全功能GPU实现HTJ2K高性能编解码,加速电影技术自主化
HTJ2K编解码控制软件界面。*图片来自《基于HTJ2K算法和国产GPU实现的数字电影图像编解码技术研究》
摩尔线程全功能GPU实现HTJ2K高性能编解码,加速电影技术自主化
*数据来自《基于HTJ2K算法和国产GPU实现的数字电影图像编解码技术研究》

测试结果证实,摩尔线程全功能GPU的编码性能显著优于CPU,尤其在高分辨率图像处理方面优势突出。以编码实测数据为例:

  • 2K分辨率:GPU编码用时0.069秒,较CPU(0.154秒)大幅缩短;
  • 4K分辨率:GPU编码用时0.249秒,仅为CPU(0.729秒)的34%,性能提升近3倍;
  • 8K分辨率:GPU处理用时1.050s秒,较CPU(2.136秒)提速1倍以上。

实验表明,在处理16bit 4∶4∶4无损压缩图像时,摩尔线程全功能GPU凭借强大的并行计算能力,可高效应对从2K到8K不同分辨率带来的计算挑战,且分辨率越高,性能优势越明显。

自主领航,共建生态

当前,国产GPU已实现实质性突破,结合我国在LED显示领域的产业链优势,为打造从“芯”到“屏”的全链路、自主知识产权国产电影放映体系奠定了坚实基础。在全球8K电影放映标准尚未形成统一规范的“窗口期”,此次技术突破为我国实现技术跨越、抢占新一代电影技术全球制高点提供了重要战略机遇。

论文地址:https://d.wanfangdata.com.cn/periodical/CiBQZXJpb2RpY2FsQ0hJU29scjkyMDI2MDExMjE3MDQyNhIQeWluZ3NqczIwMjUxMTAwMxoIbXhzbHVhc2E%3D

版权声明:本文内容转自互联网,本文观点仅代表作者本人。本站仅提供信息存储空间服务,所有权归原作者所有。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至1393616908@qq.com 举报,一经查实,本站将立刻删除。

(0)

相关推荐

发表回复

登录后才能评论