即构云端实时语音识别上线，实现语音通话实时字幕&翻译、直播字幕等功能

ZEGO即构科技 • 2025年8月6日下午2:59 • 行业资讯

近日，即构科技（ZEGO）发布云端实时语音识别 API，将语音通话、视频直播、在线会议等实时音视频场景中的语音内容实时转为文字结果。实现 1v1 语音通话实时字幕&翻译、在线会议实时字幕及会后纪要总结、全球直播字幕、直播间实时主播内容总结等场景。

ZEGO云端实时语音识别优势

延迟600ms左右：从用户说话结束到获取到ASR识别结果，仅需要600ms即可快速获得识别结果。
识别准确度提升40%+
- 为语音识别特定优化的降噪能力，去除环境噪声、远处人声等对识别的干扰
- 更优的AI 回声消除能力，去除包括直播间礼物音效、BGM、语聊房内其他用户说话等造成的误识别
相较于传统方案节省50%+成本：仅针对包含了真实有效的内容时，启动语音识别能力，提高利用率，降低成本

产品功能

识别任务维度

房间维度：将RTC房间内的所有音视频流进行识别，并分别输出识别结果，包括roomid、userid、streamid、userdata及ASR的识别结果等信息

识别语言

中文普通话、粤语、英语、韩语、日语、泰语、印度尼西亚语、越南语、马来语、菲律宾语、葡萄牙语、土耳其语、阿拉伯语、西班牙语、印地语、法语、德语、上海话、四川话、武汉话、贵阳话、昆明话、西安话、郑州话、太原话、兰州话、银川话、西宁话、南京话、合肥话、南昌话、长沙话、苏州话、杭州话、济南话、天津话、石家庄话、黑龙江话、吉林话、辽宁话

断句配置

设置断句间隔的时长，默认500ms

应用场景及接入方式

针对 RTC 房间内的所有音频流进行实时语音识别，将语音转为文字，可实现在线会议实时字幕、多语种语聊房互动、全球直播字幕等场景。

接入文档：

https://doc-zh.zego.im/cloud-realtime-asr/quick-start

了解更多，请联系我们👇

即构云端实时语音识别上线，实现语音通话实时字幕&翻译、直播字幕等功能

本文来自作者投稿，版权归原作者所有。如需转载，请注明出处：https://www.nxrte.com/zixun/60401.html

赞 (0)

ZEGO即构科技认证作者

0

应用场景

即构携手映客打造元宇宙K歌房（即构虚拟KTV方案）

2022年5月18日，映客 App 上线了业内首个元宇宙K歌玩法「全景K歌」，给用户带来前所未有的社交体验： 1、生成虚拟化身，穿越进虚拟世界玩家可以自由…

ZEGO即构科技
2022年6月2日
技术文章

即构科技数智人PaaS服务上线，简单几步即可快速集成数智人云端API

2023年10月31日，即构发布即构数智人 PaaS 服务。支持开发者通过数智人 PaaS 服务服务端 API，实现查询数智人资产、合成数智人视频（文件/流式）、合成语音、生成 A…

ZEGO即构科技
2023年11月1日
行业资讯

即构科技一体化音视频平台，安全合规助力金融业务创新提效

近年来，音视频技术正在深度影响金融业服务场景，并在业务提效上展现优势。 “某四大行之一，自2017年启动音视频技术研究与平台建设，以云网点、云工作室、云柜台作为创新着力点，截至21…

厂商动态
2023年2月21日
行业资讯

ZEGO AI Agent 升级上线”图片数字人实时对话“能力

即构科技(ZEGO)新推出的实时互动 AI Agent 2.4 “图片数字人实时对话”，是一套面向企业和开发者的实时互动 AI 技术解决方案。用户无需拍摄、无需动捕设备，也不用专…

ZEGO即构科技
2025年7月17日
行业资讯

《虚拟人应用场景与实践报告》出炉，即构入围“虚拟人产业核心玩家”

今年以来，虚拟人靠实力频频“出圈”。以度晓晓担任AI制作人的元宇宙歌会两小时观看量超5000万，柳夜熙在抖音单平台坐拥869.3万粉丝……虚拟人的商业价值和服务价值虽正在逐渐释放…

厂商动态
2022年12月28日
行业资讯

即构元宇宙社交获全国奖项

由工业和信息化部主办的第五届”绽放杯” 5G应用征集大赛正在全国火热进行中，大赛特设智慧社交专题赛，旨在打造行业标杆案例，拓展应用场景，探索新型社交互动领域…

ZEGO即构科技
2022年9月27日