技术文章
-
探索 CameraX 音视频相机技术(4):捕获图像
这个系列文章我们来介绍一位海外工程师如何探索 CameraX 音视频相机技术,对于想要开始学习音视频技术的朋友,这些文章是份不错的入门资料,这是第 4 篇:CameraX 捕获图像…
-
一文了解 Kurento:开源WebRTC流媒体服务器
Kurento 是一个开源 WebRTC 流媒体服务器,内置许多视频会议模块,以 Apache 许可发布。Kurento 于 2010 年在马德里开发,Kurento 使用的主要语言是 C++,这有助于优化系统资源。
-
5 个经典音视频开发入门项目
推荐 5 个经典音视频开发入门项目,包括FFmpeg、ijkplayer、GPUImage For Android、Grafika 和 AudioVideoRecordingSam…
-
Flutter 中使用 Pusher Channels 实现实时通信
实时通信是现代应用程序的基石,它支持即时聊天、通知和协作工具等功能。在这篇文章中,我们将探讨如何使用 pusher_channels_flutter 包将 Pusher Chann…
-
中科院发布可扩展模块化语音语言模型 LLaMA-Omni2,以最小的延迟进行实时对话
中国科学院计算技术研究所的研究人员推出了LLaMA-Omni2,这是一系列支持语音的大型语言模型(SpeechLM),现已在Hugging Face上可用。这项研究引入了一个模块化…
-
NVIDIA 开源 Parakeet TDT 0.6B:打造自动语音识别 ASR 全新标准,一秒转录一小时音频
NVIDIA 发布了Parakeet TDT 0.6B,这是一款先进的自动语音识别 (ASR) 模型,现已在Hugging Face上完全开源。该模型拥有6 亿个参数、商业许可的 …
-
即构 AI Agent 2.0 上线!快速与AI实现图文消息、实时通话等场景
上周,即构科技(ZEGO)实时互动 AI Agent 全新升级并发布 2.0,ZEGO 为 AI 智能体实时互动打造的全新一代实时互动 AI: 产品简介 ZEGO 实时互动 AI …
-
Xbox 如何悄然解决 Xbox 云游戏延迟问题
在 GDC 2025 大会上,微软详细介绍了 Xbox 云游戏的发展历程。其中最重要的一点就是性能,特别是延迟。虽然视觉效果和功能经常成为焦点,但延迟一直是 Xbox 关注的重点。…
-
基于WebRTC 视频会议协同平台40个核心功能分析
基于开源Jitsi和MiroTalk 文档,以下对基于WebRTC 视频会议协同平台的 40 个主要功能进行深入分析,涵盖技术概念和典型使用场景。
-
探索 CameraX 音视频相机技术(3):实现预览
这个系列文章我们来介绍一位海外工程师如何探索 CameraX 音视频相机技术,对于想要开始学习音视频技术的朋友,这些文章是份不错的入门资料,这是第 3 篇:CameraX 实现预览…
-
释放新的可能性:压缩和高密度工作流程如何影响体育直播制作
随着对直播内容需求的增长,广播公司必须在提高效率和成本效益的同时提供高质量的制作。压缩和高密度解决方案是现代现场直播制作技术实现这些目标的核心,使广播公司能够处理复杂的工作流程、报…
-
MAUD 提供高效途径满足大众对直播内容的需求,而不会影响 QoE
对于英国的足球爱好者来说,亚马逊 Prime Video 在本赛季特定时段(尤其是圣诞节前后的窗口期)播放英超比赛的时间似乎突然终止,这或许是个遗憾。至于英国的在线网络运营商是否也…
-
B站:流媒体技术助力直播体验提升与玩法创新
本文介绍了B站流媒体技术在春晚直播中的一些应用,包括用户体验提升和玩法创新。详细介绍B站多媒体团队是如何实现这些功能,遇到了哪些问题,都是如何解决的。
-
探索 CameraX 音视频相机技术(2):配置选项
本文介绍如何配置 CameraX 的各个用例,从而控制用例操作的不同方面。例如,在图像捕获用例中,可以设置目标纵横比和闪光灯模式。并提供代码示例。
-
使用 WebRTC、React 和 NestJS 构建视频聊天应用程序
在当今万物互联的世界里,实时通信应用已成为个人和专业应用的必需品。尤其是视频聊天应用程序,其受欢迎程度呈指数级增长,而全球性事件导致远程互动的需求也加速了这一趋势。 在本综合指南中…
-
体育直播如何发展,为什么无缝传输比以往任何时候都更重要
短短几年间,我们观看体育直播的方式发生了翻天覆地的变化。过去,观众只需收看一家广播公司的节目,而现在则有多种平台可供选择,从传统的线性频道到 OTT 服务和虚拟的多频道视频节目分销…
-
探索 CameraX 音视频相机技术(1):CameraX 架构
本篇文章涵盖了 CameraX 的架构,包括其结构、如何使用 API、如何处理生命周期以及如何组合用例。
-
微软发布 Agentic AI 系统故障模式综合指南
随着 Agentic AI 系统的发展,确保其可靠性、安全性和保障性的复杂性也相应增加。认识到这一点后,微软 AI Red Team(AIRT)发布了一份详细的分类报告,阐述了代理…
-
字节跳动推出 QuaDMix:用于 LLM 预训练的数据质量和多样性的统一 AI 框架
大型语言模型 (LLM) 的预训练效率和泛化能力受到底层训练语料库质量和多样性的显著影响。传统的数据管理流程通常将质量和多样性视为独立的目标,先进行质量过滤,然后再进行领域平衡。这…
-
SIPSorcery 简介、整体架构、核心功能及应用场景
SIPSorcery是一个支持SIP和WebRTC的跨平台库,使用户能够进行音视频通信。该库的主体设计为平台无关,可在任何支持.NET Standard 2.0的平台上运行。它能处…