技术文章
-
AVCHD 与 MP4 格式有什么区别?
在 AVCHD 和 MP4 视频格式之间犹豫不决?本文分析了这两种流行格式的主要区别,包括视频质量、文件大小、兼容性和编辑难易程度。了解哪种格式最适合您的需求! 什么是 AVCHD…
-
探索 CameraX 音视频相机技术(8):MLKit 分析器
这个系列文章我们来介绍一位海外工程师如何探索 CameraX 音视频相机技术,对于想要开始学习音视频技术的朋友,这些文章是份不错的入门资料,这是第 8 篇:CameraX MLKi…
-
OpenSIPS 3.6 引入 SIP 套接字管理,实现SBC和SIP中继连接性动态支持
对于像 OpenSIPS 这样的高性能 SIP 平台来说,灵活性和正常运行时间至关重要,尤其是在涉及会话边界控制器 (SBC) 和中继服务的场景中。传统上,OpenSIPS 仅支持…
-
B站:直播生态治理体系建设
1. 背景 随着直播行业蓬勃发展,行业规模持续扩大,平台正在积极构建更加规范、健康的直播环境。在这一进程中,通过完善内容审核机制、提升主播职业素养、完善直播规范等举措,不断净化网络…
-
探索 CameraX 音视频相机技术(7):扩展 API
CameraX 提供了一个扩展 API,用于访问设备制造商在各种 Android 设备上实现的扩展功能。CameraX 扩展 API 管理查询可用扩展、配置扩展相机会话以及与 Camera Extensions OEM 库通信。
-
PrimeIntellect 发布 INTELLECT-2:通过分布式异步强化学习训练的 32B 推理模型
随着语言模型在参数数量和推理复杂度方面的不断增长,传统的集中式训练流程面临着越来越多的限制。高性能模型训练通常依赖于紧密耦合且具有快速互连的计算集群,这些集群成本高昂、可用性有限,…
-
AG-UI:一个开放、轻量级、基于事件的协议,规范了 AI 代理与前端应用程序的连接方式
新一代 AI agent(AI 代理)在汇总、数据迁移和调度等后端任务自动化方面取得了重大进展。虽然效果显著,但这些代理通常是在幕后运行——由预定义的工作流触发并返回结果,无需用户…
-
离线视频-LLM 现可理解实时视频流:苹果研究人员推出 StreamBridge,实现多轮主动视频理解
Video-LLM 可以一次性处理整个预先录制的视频。然而,像机器人技术和自动驾驶这样的应用需要对在线视觉信息进行因果感知和解读。这种根本性的不匹配表明了当前 Video-LLM …
-
NVIDIA AI 推出 Audio-SDS:基于扩散的统一框架,无需专门数据集即可实现提示引导音频合成和源分离
音频扩散模型已经实现了高质量的语音、音乐和拟音合成,但它们主要擅长样本生成而非参数优化。诸如基于物理信息的撞击声生成或提示驱动的声源分离等任务,需要能够在结构约束下调整明确、可解释…
-
边缘连接架构:设计覆盖全球企业网络的分布式低延迟路由层
随着企业将其数字化运营扩展到全球基础设施,对低延迟、分布式连接的需求也空前高涨。随着云计算、物联网和人工智能驱动型应用的兴起,企业需要无缝、可靠且可扩展的网络架构来确保高效的数据流…
-
如何使用 Expo 和 WebRTC 构建视频通话应用(最简单的方法)
由于兼容性问题和缺乏明确的指导,许多开发人员在将 WebRTC 集成到 Expo 应用程序时面临挑战。本文将探讨使用 Expo 和 WebRTC 构建视频通话应用程序的最简单方法。…
-
浏览器如何处理音频流:MediaRecorder 与 Web Audio API
有没有想过,网站是如何让您录制语音笔记、玩带有动态音效的互动游戏,甚至将音乐可视化的?这些神奇的事情就发生在浏览器中,由专门用于处理音频流的复杂 JavaScript API 驱动…
-
探索 CameraX 音视频相机技术(6):视频捕获架构
这个系列文章我们来介绍一位海外工程师如何探索 CameraX 音视频相机技术,对于想要开始学习音视频技术的朋友,这些文章是份不错的入门资料,这是第 6 篇:CameraX 视频捕获…
-
一个线程是否可以有多个 OpenGL 上下文?
OpenGL 上下文(OpenGL Context)是一个包含了 OpenGL 所有状态信息的环境,是你与 GPU 进行任何 OpenGL 调用之前必须建立的基础。 简单…
-
探索 CameraX 音视频相机技术(5):图像分析
这个系列文章我们来介绍一位海外工程师如何探索 CameraX 音视频相机技术,对于想要开始学习音视频技术的朋友,这些文章是份不错的入门资料,这是第 5 篇:CameraX 图像分析…
-
技术焦点:利用 AR 和虚拟制作提升体育广播的沉浸感
沉浸式技术正在重塑体育广播,其解决方案使制作更具活力、更具吸引力。从AR图形到实时虚拟制作演播室,这些技术的进步正在提升效率并增强叙事效果。 “广播公司越来越倾向于沉浸式体育体验,…
-
WebRTC 视频调试:如何使用 video_replay 重现和修复问题
调试 WebRTC 应用程序中的视频问题是一项极具挑战性的任务。由于底层存在众多可变部件,要准确找出问题的原因无异于大海捞针。最有效的策略之一就是在受控环境中持续重现问题。 在本篇…
-
探索 CameraX 音视频相机技术(4):捕获图像
这个系列文章我们来介绍一位海外工程师如何探索 CameraX 音视频相机技术,对于想要开始学习音视频技术的朋友,这些文章是份不错的入门资料,这是第 4 篇:CameraX 捕获图像…
-
一文了解 Kurento:开源WebRTC流媒体服务器
Kurento 是一个开源 WebRTC 流媒体服务器,内置许多视频会议模块,以 Apache 许可发布。Kurento 于 2010 年在马德里开发,Kurento 使用的主要语言是 C++,这有助于优化系统资源。
-
5 个经典音视频开发入门项目
推荐 5 个经典音视频开发入门项目,包括FFmpeg、ijkplayer、GPUImage For Android、Grafika 和 AudioVideoRecordingSam…