ZEGO 实时传译上线,提供实时语音识别和文本翻译功能

ZEGO 实时传译(ZegoRealtimeTranslation),是 ZEGO 携手智能语音行业生态服务商提供的实时语音转写及翻译服务,通过 SDK 接入后,提供将音频流实时识别成文本并翻译转写成目标语言的服务,达到“边说话边输出文字”等无障碍沟通效果。实时传译支持中文、英语、日语、韩语、法语、西班牙语等多种主流语种,适用于会议实时转写、直播字幕、跨国交流、录音质检、音频内容分析等场景。

ZEGO 实时传译上线,提供实时语音识别和文本翻译功能

实时传译产品架构

ZEGO 实时传译上线,提供实时语音识别和文本翻译功能

实时传译功能特性

实时传译方式产品功能描述
实时语音转写实时语音识别实时语音云端转文字并回调结果,适用于长句语音输入,支持识别 100 多种语言。
智能断句根据语义进行智能断句,输出带有标点的语音识别结果和翻译结果。
语种自动检测输入语音中包含多种语言时,能够准确识别目前支持语种,包括:中文、英语、日语、韩语、俄语、法语、西班牙语、德语。
自动标点语音识别后的文本可自动添加标点。
实时文本翻译实时文本翻译实时将源语言翻译成指定的目标语言。
文本中间结果翻译在语音输入过程中即开始翻译,输入结束后,智能优化翻译结果,支持自定义打开或关闭中间结果翻译功能。
文本翻译频率设置可以设置文本翻译的频率。

平台兼容

ZEGO 实时传译 SDK 支持 iOS、Android 平台,支持平台间互通,具体的兼容性要求见下表。

平台SDKDemo兼容性
iOS支持支持最低兼容 iOS 11.0
Android支持支持最低兼容 Android 8.0

支持说明

支持情况规格说明
音频格式实时传译支持的音频格式,请参考 规格说明
支持语种实时传译支持语种,请参考 规格说明
支持区域实时传译支持的区域,请参考规格说明(同上)。

应用场景

视频直播字幕

在视频或赛事等直播场景中,支持将音频实时转换成文字,用于实时字幕展示,提升直播体验效果。

实时会议记录

在线上会议、跨国会议、大型展会、宣讲会等各类大小会议场景中,支持将多角色发言人的语音实时转换成文本,提高会议传达效率,降低会议记录编写成本,准确高效输出会议记录。

跨国异地交流

在各种国际多语言线上交流场景中,支持实时展示各角色发言内容并翻译,打破语言交流障碍,让跨国沟通变得更轻松更简单。

智能客服

将通话记录实时转成文字,可以实现智能外呼和实时质检,协助企业分析语音内容,锁定风险语音,提升质检覆盖度。

课堂音频识别

对老师课堂内容实时记录并转换成文本,校方可以进行教学内容记录以及教学质量评估,助力高校教学评估能力建设。

产品优势

一站式灵活选择,低门槛按需接入

一站式接入科大讯飞、谷歌等行业主流智能语音服务商产品服务,减少单独对接的沟通成本,助力产品快速上线。实时传译支持按需选择,自由搭配使用,灵活切换体验不同语音识别、文本翻译产品效果。

多语种识别,多场景覆盖

覆盖国际常用语种互译,广泛应用于语音转文本提效、跨语种内容生产及分享等社交、办公、娱乐场景。例如,赛事或秀场直播、1v1 交友、IM 私信聊天、会议或视频字幕制作等业务,可满足复杂语言环境的场景需求。

超低延时,快速响应

音频流支持毫秒级识别,可实时生成翻译结果,实现字幕与音画完全同步,且感知无时延,用户体验佳。

语义理解,智能纠错

在返回实时转写结果的同时,通过上下文信息进行语义理解,将中间结果进行智能纠错,并根据语音的内容理解和停顿,智能匹配标点符号,确保识别的高准确率。

精准识别,高效输出

在复杂噪声场景中(如演讲、会议场景),支持精确转写和翻译,中文(普通话)识别率可达 95%。

本文为原创稿件,版权归作者所有,如需转载,请注明出处:https://www.nxrte.com/jishu/24304.html

(1)

相关推荐

发表回复

登录后才能评论