技术文章
-
小程序如何实现IM即时通讯多人聊天
目前微信小程序IM即时通讯多人聊天应用非常广泛,比如电商购物场景,买家和卖家、客服之间需要通信,发送文本、图片、订单等消息;互动直播场景中的弹幕消息、礼物消息,语聊房内的麦位控制等…
-
语音SDK是什么意思?即构语音SDK有哪些优势
语音SDK是什么意思 语音SDK简单来说就是一个软件开发工具包,集合了许多语音服务功能,开发者通过集成 SDK 可以快速实现各种语音类功能。 比如即构实时语音SDK(Express…
-
B站第三代转码体系下流式转码测试实践
B站第三代转码体系下引入了流式转码,以解决同稿件下多条转码任务的重复切片问题、转码临时产物大文件导致的耗时问题,以及非必要的IO和算力开销问题。
-
WebRTC SDK实现一个简单的实时音视频通话
本文介绍如何基于ZEGO即构科技的 WebRTC SDK(ZEGO Express Web SDK)快速实现一个简单的实时音视频通话。 WebRTC 是一个支持网页浏览器进行实时语…
-
技术洞察:音频驱动口型生成技术解析 | 咪咕灯塔智库
写在前面:在 AIGC 时代,数字人和影视动画行业快速发展,如何让角色的口型与音频完美同步,成为提升沉浸感的关键技术之一。音频驱动口型生成技术,通过算法将音频信号转化为逼真的唇形动…
-
模型上下文协议 MCP 是 AI 基础设施中缺失的标准吗?
本文将深入探讨 MCP 的起源、技术原理、优势、局限性、实际应用以及未来发展轨迹,并借鉴行业领袖的见解和截至 2025 年中期的早期实施案例。
-
播放器视频后处理实践(一)
本文将系统介绍我们在播放器视频后处理模块中的技术方案与工程实现,涵盖从效果设计、算法选型,到性能优化和跨平台兼容的全链路细节。
-
如何在云端录制中录制完整动态 PPT(ppt动画怎么录制)
在远程会议、在线教育场景中,使用具备动画效果的动态 PPT 可以快速引起观看者的兴趣,通过在 PPT 内添加丰富的动画效果和音、视频内容,也可以让观众快速理解主讲人所表达的观点。 …
-
Cocos Creator 中如何实现音视频通话功能
本文将介绍如何基于即构 Cocos Creator音视频SDK 快速实现一个简单的实时音视频通话。 即构 Cocos Creator 音视频SDK 能够为开发者提供便捷接入、高清流…
-
如何利用 SEI 解决音画不同步的问题
本文将从 SEI 的基础概念出发,结合数据流录制回放的需求和应用场景,带大家了解一下 ZEGO即构科技是如何利用 SEI 去解决音画不同步的问题,以及开发过程中可能踩到的坑。
-
如何使用 Amazon Nova Sonic 和 WebSockets 构建完整的语音对话系统
随着人工智能技术的飞速发展,自然语言处理和语音交互技术正在深刻改变人机交互的方式。语音交互正从简单的“机械应答”向更自然的“类人对话”演进。 传统的语音系统通常采用模块化架构,将语…
-
avr-infra:基于 Asterisk 集成 Core、ASR、LLM 和 TTS 开源服务
Agent Voice Response (AVR) 是一款基于 Asterisk 构建的 Docker 可部署对话式 AI 系统。选择您偏好的 ASR、LLM 和 TTS 提供商…
-
语音通话开源示例1:语聊房demo示例源码及运行指引
本文提供 ZEGO 语聊房demo示例源码及运行指引,方便开发者快速体验 ZEGO 语音通话SDK产品功能。 语聊房是指在线语音连麦虚拟房间,每个房间设有4-8个麦位,主播在麦上聊…
-
uni-app美颜SDK:在uni-app实现音视频美颜滤镜功能
uni-app 是一个使用 Vue.js 开发所有前端应用的框架,开发者编写一套代码,可发布到iOS、Android、Web(响应式)、以及各种小程序(微信/支付宝/百度/头条/飞…
-
MNN LLM Chat iOS 流式输出优化实践
本文介绍了在 iOS 平台上使用 MNN 框架部署大语言模型(LLM)时,针对聊天应用中文字流式输出卡顿问题的优化实践。通过分析模型输出与 UI 更新不匹配、频繁刷新导致性能瓶颈以…
-
内容分发网络:CDN 和 eCDN 之间有什么区别?
快速发展的数字化工作场所要求企业越来越依赖视频,从内部直播到混合工作场所的流媒体。Microsoft Teams 和 Zoom 等协作工具的兴起加速了这一趋势,使得可靠、安全、高质…
-
为什么每个人都在衡量编码器的计算效率
提供高质量观看体验并降低成本的能力,正在成为各地流媒体视频运营团队的追求。无论您的业务模式是围绕免费广告支持流媒体 (FAST) 还是基于订阅的优质内容,转码都是与制作相关的最重要…
-
Guardrails AI 推出 Snowglobe:AI 代理和聊天机器人的模拟引擎
Guardrails AI 宣布全面推出 Snowglobe,这是一款突破性的模拟引擎,旨在解决对话式 AI 中最棘手的挑战之一:在 AI 代理/聊天机器人投入生产之前对其进行大规…
-
什么是AI降噪?AI降噪在音视频通话中的应用
清晰的音视频质量对于有效沟通至关重要。 无论是视频会议、电话、直播还是语音社交,背景噪音都会显著降低聆听体验并阻碍沟通。 随着人工智能 (AI) 的进步,AI 降噪技术成为应对这一…
-
FFmpeg 开发中的 10 个实用小技巧
FFmpeg 是一个强大的多媒体框架,开发过程中掌握一些小技巧可以大大提高效率。以下是一些实用的开发技巧: 调试技巧 1. 启用详细日志 2. 检查返回值 性能优化 3. 使用硬件…