Shotcut 25.10 开源视频编辑器的首个测试版发布。这款适用于 Linux 系统的著名视频编辑应用程序正在推出更多 AI 功能。
自去年起,Shotcut 已逐步整合 AI 特性,例如集成 OpenAI 的 Whisper 实现语音转文字支持。而Shotcut 25.10 则实现了文字转语音功能的反向支持。
Shotcut 25.10 测试版为程序的注释和字幕功能新增了文本转语音支持。该功能采用 KokoroDoki 实现实时文本转语音,其底层基于 Kokoro 82M 轻量级 TTS 模型。KokoroDoki 可同时调用 CPU 或搭载 CUDA技术的 NVIDIA GPU 进行加速处理。KokoroDoki 支持多语言及多种语音,所有功能均在本地设备运行。其中(美式)英语支持超过 20 种语音,英式英语支持8种语音,其他语言覆盖范围较少。
该文本转语音功能的复杂性在于其依赖 Docker 等技术环境进行执行。

Shotcut 25.10 测试版新增了“文字:打字机”视频滤镜,通过 Chrome/Chromium 实现了“从 HTML 导入图像/视频”功能,并开始采用 FFmpeg 8.0 库及其他更新。即将发布的 Shotcut 25.10 视频编辑器更新中还包含大量其他修复与改进。
Shotcut 25.10 测试版下载及更多开源视频编辑器更新详情请访问GitHub。
本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/zixun/62034.html