技术文章
-
ZEGO即时通讯SDK 2.19.0 版本发布,新增组合消息、图片格式等功能
1月6日,ZEGO即时通讯SDK(ZIM)发布 2.19.0 版本,新增组合消息、图片消息格式、图片宽高信息等功能,并改进优化了部分接口。 新增功能 新增组合消息类型,支持在一条消…
-
技术焦点:云端顶级体育赛事制作常态化
云计算使体育节目制作能够以更具创造性和更高效的方式访问内容并与合作伙伴协作。几年前,完全基于云的制作还不被认为是高端体育节目制作的一个重要候选方案,但现在,云技术几乎没有不涉及的工…
-
音视频面试题集锦第 40 期:WebRTC 方向
分享来自音视频技术社群关键帧的音视频开发圈——音视频面试题集锦第 40 期:WebRTC 方向相关内容。 下面是几道 WebRTC 技术相关的面试题: 1、请详细解释 WebRTC…
-
学习 Socket.IO 实现实时数据共享:聊天应用程序示例
Socket.IO 是一个功能强大的库,用于在 Web 客户端和服务器之间进行实时双向通信。它通常用于构建聊天应用、游戏平台和协作工具等应用程序。本文将介绍如何使用 Socket….
-
HBI V2:一种灵活的 AI 框架,可通过多元合作游戏提升视频语言学习
视频语言表征学习是多模态表征学习的一个重要子领域,它专注于视频与其相关文本描述之间的关系。它在许多领域都有应用,从问答和文本检索到摘要。在这方面,对比学习已经成为一种强大的技术,它…
-
聊一聊保护WebRTC通信安全的几个最佳实践
在 2025 年保护您的 WebRTC 应用程序,从这里开始。WebRTC 提供了加密的实时通信,但其安全性依赖于正确的实现。以下是确保 WebRTC 通信安全的 6 个关键做法:…
-
VITA-1.5:多模态大语言模型,通过三阶段训练方法整合视觉、语言和语音
VITA-1.5,这是一种多模态大型语言模型,通过精心设计的三阶段训练方法将视觉、语言和语音融为一体。
-
Dolphin 3.0 发布(Llama 3.1 + 3.2 + Qwen 2.5):本地优先、可操控的 AI 模型
人工智能已经取得了长足进步,改变了我们的工作、生活和互动方式。然而,挑战依然存在。许多人工智能系统严重依赖基于云的基础设施,这引发了合理的隐私担忧。其他系统提供有限的用户控制,使定…
-
如何使用 Rust 和 Tokio 构建高性能 WebSocket 聊天服务器
本文分享如何使用 Rust 和 Tokio 构建高性能 WebSocket 聊天服务器。我们将创建一个能处理多个并发连接、广播消息和管理用户状态的服务器。 项目设置 在Cargo….
-
利用 AI 模型提高视频流中手语的无障碍性
流媒体能够连接不同的观众,但让所有人都能观看视频内容仍然是一项挑战。无障碍必须成为优先事项,尤其是对于面临独特障碍的聋哑和听力障碍观众。虽然传统字幕(音频和视频)对某些人有帮助,但…
-
什么是 NVOD?VOD 和 NVOD 有什么区别
视频流媒体改变了我们如今观看喜爱内容的方式。目前,大部分家庭至少拥有一项订阅式流媒体服务。这一转变创造了提供电视节目服务的新方式。 视频点播 (VOD) 让观众可以随心选择观看内容…
-
通过流匹配实现高效、高质量的文本转音频生成
文本转音频生成技术彻底改变了音频内容的创建方式,使传统上需要大量专业知识和时间的流程自动化。该技术可以将文本提示转换为丰富多样且富有表现力的音频,从而简化音频制作和创意行业的工作流…
-
设计类 YouTube 应用:深入了解视频流架构
YouTube 已成为视频共享和流媒体的代名词。无论你是想掌握食谱、学习编码,还是观看苹果公司发布最新的技术创新,YouTube 都能满足你的需求。很难想象没有这个平台的日子,它已…
-
调试 FFmpeg 7:版本迁移和操作符优先级之旅
在数字视频处理和流媒体领域,FFmpeg 是不可或缺的基石。作为领先的开源多媒体框架,它为从 Blender 等视频编辑软件到 YouTube 等流媒体巨头的无数应用程序和服务提供…
-
AutoSculpt:基于模式的自动剪枝框架,旨在利用图形学习和深度强化学习提高效率和准确性
由于深度神经网络 (DNN) 计算密集型的特性,在智能手机和自动驾驶汽车等边缘设备上部署深度神经网络 (DNN) 仍然是一项重大挑战。大多数现有的剪枝算法都难以在高压缩率和推理精度…
-
FFmpeg 改进了对 Flash 视频“FLV”的支持,支持多轨音频/视频
近日,FFmpeg 多媒体库对 Flash 视频 (FLV) 支持进行了新一轮改进。 对于那些在进入 2025 年后仍对 Flash 视频 (FLV) 容器文件格式感兴趣的人来说,…
-
编辑和特效工具内存问题导致程序崩溃原因分析和解决丨音视频实战经验
分享来自音视频开发圈“关键帧Keyframe”的文章。 分析和解决编辑和特效工具内存问题导致的程序崩溃,这里的核心问题是在媒体处理过程中的内存管理,关键方面包括: 考虑到崩溃场景,…
-
大数据集场景中的 OpenSIPS 集群强化
OpenSIPS 中的集群支持是一个具有挑战性的领域,并且不断发展。即使自其初始版本发布以来已经过去了很多年,我们仍然发现需要理解和解决的具有挑战性的场景。生产环境,尤其是涉及大量…
-
微软和清华大学推出Distilled Decoding:在自回归模型中加速图像生成而无质量损失的新方法
自回归 (AR) 模型改变了图像生成领域,为生成高质量视觉效果树立了新标杆。这些模型将图像创建过程分解为连续步骤,每个标记都基于先前的标记生成,从而创建具有出色真实感和连贯性的输出…
-
视频播放花屏问题的分析和解决丨音视频实战经验
当遇到视频播放器花屏时,我们可以从多个层面来思考这个问题。首先要理清视频播放的整个链路:从解码、渲染到显示,每个环节都可能导致花屏。