实现万人实时连麦互动技术难点(实时互动RTI能力系列篇3)

早在五年前,ZEGO就推出了支持32人实时互动的视频通话连麦技术,比苹果的FaceTime早一年实现该能力。

但时至今日,在大多数用户的感知中,支持同时上麦互动的人数也并未显著提升。在线上会议、直播等使用线上互动的场景中,还是20人以内的实时连麦覆盖大多数实际使用情况。

为何实时连麦所支持的在线人数增长缓慢?在当前小规模互动居多的线上交流中,追求实时连麦的人数规模又有何意义?

随着ZEGO Express SDK 3.0上线大规模连麦能力,我们今天就从以上两个问题说开去,解读大规模实时互动的技术难点和价值意义。

为何实时连麦人数难以突破?

高昂的流量成本

在原有的技术路径中去实现多人实时连麦,是每一位用户同时拉取其他所有在线用户的音视频流。以100人为例,即使他们仅通过语音连麦,按照会议场景的常用规格16kbps计算,100人实时语音连麦的千分钟流量消耗接近1.2TB ,而流量消耗还并非音视频通讯成本的全部。

大型在线会议SaaS平台每日分钟数动辄需要以千万来计算,当线上交流的成本直逼航空公司票价时,互联网立身之本的便利、快捷还能否说服企业、用户为之付费就需要另行商榷了。

性能限制&信息有效性

即使暂且对高昂的流量费用闭上一只眼睛,但同时拉取几十上百条音视频流也是对用户端设备性能的一场拷问。通过移动端设备实时开会原本是一众线上会议平台刻在基因中的优势,但同时移动端有限的算力也成为了限制并发数量提升的瓶颈。

当我们真正深入去思考多人实时连麦的使用场景,就能发现让1000个人同时开口说话既不现实,也无法形成有效的信息交换。

更有可能出现的情况是,少数人在讨论,更多人在聆听并伺机发言提出自己的建议。大规模的连麦真正带给所有人的——是可以随时开口交流并且被人听到的权利。

高并发带来的云服务压力

在一场大规模的线上连麦交流中,受到考验的不仅是用户端设备的性能,服务商的节点资源分配、负载均衡、扩容以及网络连通等关键技术都在经历一场大考,传统的音视频云服务架构难以支撑。

大规模连麦在何处体现价值?

在已有实例参考的线上会议、直播等场景中,大规模连麦能够扩大互动规模,让部门会议变为公司、集团会议;能让一起看球、看电影的一起X场景,从数十人的小型同好会变成超大型的俱乐部、论坛,与更多人分享激动、喜悦。

不仅如此,大规模连麦技术的出现,还为元宇宙中的大规模实时互动提供了基座能力。在类RPG的网游中,同场景同屏出现几百上千玩家的情况并不少见,在玩家间互动仅支持IM消息,世界喇叭的时代,玩家间的互动距离沉浸感还有相当的距离。

而大规模连麦的出现,则让每一个身处虚拟空间的用户有了自由交流,畅所欲言的可能。


图片

大规模连麦如何突破?

ZEGO针对纯线上和虚拟空间两种场景推出了动态语音活跃度监测、动态用户兴趣范围两种云端智能选路策略。

动态语音活跃度监测能对所有用户的语音活跃度进行监测,将语音活跃度最高的x条(x可自定义设置)音视频流拉取到用户端,并随着活跃度的变化实时更新,在节省流量的同时保证有效沟通。

动态用户兴趣范围可以基于虚拟空间中用户的实时位置与AOI(Area of Interest),将用户AOI范围内的距离用户最近的x条(x可自定义设置)拉取到用户端,同时借助空间音频能力,实现声音近大远小、左右前后的方向感,还原现实世界中的听觉感受,让音质体验更具沉浸感。

AOI(Area of Interest):虚拟世界中用户看到(渲染)和听到的范围。该能力的使用能够极大地减少服务器成本与客户成本,降低流量与客户端性能消耗。

同时为了应对单房间超高并发对云服务的考验,ZEGO自研海量有序数据网络MSDN,覆盖全球212个国家和地区,实现了全球范围内优质的智能调度系统保证用户在任意时间地点都能使用最优节点,用无状态的分布式、多中心、多层音视频服务架构轻松应对超大并发。

结语

我们相信实时互动RTI能为用户带来的不仅是技术上的稳定支持,还有在探索构筑未来时的切实助力。

作为首家支持单房间内万人实时连麦互动的技术服务商,大规模连麦这一能力的推出除了拓宽实时互动技术的边界以满足当前市场、用户的需求同时也是ZEGO对于支撑未来用户在元宇宙世界中共享时空的创新和突破。

即构实时音视频SDK-万人连麦功能免费体验入口:https://doc-zh.zego.im/article/5416

本文为原创稿件,版权归作者所有,如需转载,请注明出处:https://www.nxrte.com/jishu/yinshipin/5073.html

(1)

相关推荐

发表回复

登录后才能评论