技术文章
-
Microsoft Azure 中 VoIP 的高可用性
对于追求可扩展性和灵活性的提供商来说,在云中运行 VoIP 服务已成为一种常见的方法。典型的高可用性解决方案包括一对主动/备用服务器,其中只有一台服务器处于活动状态,其他服务器作为…
-
FFmpeg H.265透明视频解码
作者:quink来源:Fun With FFmpeg链接:https://mp.weixin.qq.com/s/xzKF0k7V3mh1bnB-Vduzng 一、透明视频的应用场景…
-
使用 Socket.io 和 MERN 构建实时聊天应用程序
在当今的数字时代,实时通信是现代 Web 应用的基石。无论是客户支持、游戏还是社交网络,即时收发信息的能力都至关重要。在本文中,我们将探讨如何使用 Socket.io 和 MERN…
-
构建完全端到端加密的 PHP 聊天应用程序
此时此刻,在某个地方,你自以为私密的对话正被不怀好意的人读取。数据泄露的新闻隔三差五就会见诸报端,老实说,隐私已经不再是你想当然的东西了。 如果你是一名 PHP 开发人员,你需要从…
-
WebRTC Node.js 实时通信指南
学习用于实时通信的 WebRTC Node.js、编码示例以及创建自己应用程序的技巧! 随着技术的进步,我们经常发现自己需要更快、更高效的方式来相互连接。在本文将引导您了解 Web…
-
Zyphra 推出 Zonos 测试版:具有高保真语音克隆功能的高度表现力 TTS 模型
近年来,文本转语音 (TTS) 技术取得了长足进步,但在创建自然、富有表现力和高保真的语音合成方面仍然存在挑战。许多 TTS 系统难以复制人类语音的细微差别,例如语调、情感和口音,…
-
WebRTC API 更新 2025
本文内容来自 WebRTC 专家 Olivier Anguenot 的分享。 对于 WebRTC API 而言,2024 年是无聊的一年吗?2024 年,没有全新的 WebRTC …
-
WebRTC 应用程序故障排除的基本工具和技术
通过 WebRTC 的强大功能,数百万人可以与各大洲的同事进行面对面连接、在虚拟白板上实时协作、与支持团队共享屏幕等等。然而,当问题出现时,在复杂的连接网络中找出根本原因就像大海捞…
-
Eyevinn Technology 的开源对讲解决方案
长期以来,广播领域的传统对讲系统一直由专有解决方案主导,这些解决方案成本高昂,基础设施僵化。广播公司经常发现自己被锁定在昂贵且不灵活的系统中,这限制了他们适应和扩展的能力。为了应对…
-
B站自研的第二代视频连麦系统(上):如何使用WebRTC的标准应用编程接口来接入视频连麦业务
本系列文章将从客户端、服务器以及音视频编码优化三个层面,介绍如何基于WebRTC构建视频连麦系统。希望通过这一系列的讲解,帮助开发者更全面地了解 WebRTC 的核心技术与实践应用…
-
Meta AI 推出 MILS:一种无需训练的多模态 AI 框架,用于零样本图像、视频和音频理解
大型语言模型 (LLM) 主要用于基于文本的任务,这限制了它们解释和生成多模态内容(例如图像、视频和音频)的能力。传统上,多模态操作是针对大量标记数据进行训练的任务特定模型,这使得…
-
字节跳动推出 OmniHuman-1:基于单一人体图像和运动信号生成人体视频的端到端多模态框架
尽管人工智能驱动的人体动画取得了进展,但现有模型在动作逼真度、适应性和可扩展性方面往往面临限制。许多模型难以生成流畅的肢体动作,并且依赖于过滤后的训练数据集,这限制了它们处理各种场…
-
Yandex 开发并开源 Perforator:一款每年可为企业节省数十亿美元服务器基础设施费用的开源工具
科技公司 Yandex 开发并开源了Perforator,这是一种用于对服务器和应用程序进行持续实时监控和分析的创新工具。 Perforator 可帮助开发人员识别资源最密集的代码…
-
如何使用 WebRTC 和 React 构建实时代码协作编辑器
远程办公越来越多,实时协作工具已成为开发团队必不可少的工具。虽然有 VS Code Live Share 这样的平台,但了解如何创建自己的协作代码编辑器可以为实时同步和点对点通信提…
-
Google AI 推出 Learn-by-Interact:一种以数据为中心的自适应高效 LLM 代理开发框架
由大型语言模型(LLM)驱动的自主代理研究已显示出在提高人类生产力方面的巨大潜力。这些代理旨在协助完成各种任务,例如编码、数据分析和网页导航。它们通过自动执行常规数字任务,让用户专…
-
如何使用 Docker 安装 Asterisk?
VoIP 不只是技术人员的专利。它适用于任何准备深入 SIP、pjsip 和扩展世界的人,同时还能玩转 Docker!本文将向你展示如何使用 Docker 安装 Asterisk(…
-
EvaByte:由 EVA 提供支持的开源 6.5B 先进无标记语言模型
标记化是将文本分解成更小单元的过程,长期以来一直是自然语言处理 (NLP) 中的一个基本步骤。然而,它带来了一些挑战。基于标记器的语言模型 (LM) 经常难以处理多语言文本、词汇表…
-
PC 中沉浸式音频体验的高级信号处理
在数字创新时代,音频质量已成为 PC(personal computing) 的一个决定性特征。无论是游戏、视频会议、内容创建还是媒体消费,对沉浸式的高品质音频体验的需求都在不断增…
-
WebAssembly视频检测在社区创作平台的落地与实践 | 得物技术
一 背景&现状 创作者服务平台作为得物为社区创作者提供的PC端视频发布入口,地位非常重要。且随着功能的升级迭代,用户群体也越来越多。但我们偶尔会收到如下反馈: 视频的损坏不…
-
使用 WebRTC 和 Web Audio API 构建低延迟音乐协作应用程序
远程音乐协作已大为流行,但许多解决方案都因延迟问题而无法实现实时性能。在本文中,我们将使用 WebRTC 和 Web Audio API 构建一个低延迟音乐协作应用程序,使音乐家们…