按时间归档:2023年
-
顺丰科技基于WeNet端到端语音识别方案落地
顺丰作为国内领先的快递物流综合服务商,一直致力于为用户提供更优质、更高效便捷的快递物流服务。顺丰科技作为顺丰集团旗下的科技公司,以科技深耕于物流与供应链行业,通过在大数据、人工智能…
-
H.264 与 H.265:直播流媒体常用协议的区别
深入了解 H.264 与 H.265 之间的差异 正如俗话说的一般,技术总是在进步,以便为用户提供更多便利。有时这些差异可能是巨大的,而在其他时候,几乎是微不足道的。但在不断扩展的…
-
Web 平台规模化部署高效编码格式的实践和思考
随着 Chrome 在 107 版本支持 H.265 的硬解,以及 Web 平台上 H.265 软解技术的成熟,在 Web 平台上规模化部署 H.265 视频的时机已经成熟。关于 …
-
增强现实 (AR) 与虚拟现实 (VR) 的区别
在当前快节奏的环境中,AR 和 VR 都变得越来越有用。这两种技术有很多共同点,但也有很大不同。因此,在本文中,我们将解释增强现实和虚拟现实之间的区别。 什么是 AR 与 VR? …
-
使用什么数据库来支持我们的 AI 聊天机器人
在AISPEECH,我们为广泛的实体提供对话式人工智能服务和自然语言交互解决方案,包括金融机构、政府和IoV和IoT公司。如果你相信大数据是人工智能的燃料这一观点,你会发现一个高性…
-
工业元宇宙:元宇宙的起点?
工业元宇宙——一个镜像和模拟真实机器、工厂、城市、交通网络和其他高度复杂系统的元宇宙——将为其参与者提供完全身临其境、实时、交互、持久和同步的真实世界的表达和模拟。 现有和正在开发…
-
Diffusion Video Autoencoders:通过分解视频编码实现时间上一致的人脸视频编辑 | CVPR 2023
作为近两年大火的生成模型,扩散模型在图像合成任务上表现突出,近期也有一些工作将扩散模型引入视频合成与编辑任务。本文提出将扩散模型扩展到人脸视频编辑任务中,提出了一个扩散自动编码器的…
-
2023年 CPaaS 趋势观察
在过去六年,提供CPaaS的供应商数量显著增加,仅在过去两年就有七家公司加入。加入云原生通信提供商(如Twilio、Nexmo、Bandwidth和Plivo)阵营的有短信聚合商、…
-
从文本到意义:自然语言处理算法的工作原理
自然语言处理 (NLP) 是一个结合计算机科学和语言学以帮助机器理解人类语言的研究领域。NLP 已成为现代技术不可或缺的一部分,为从聊天机器人到语音助手的一切提供动力。但是 NLP…
-
将 UC 与高质量的音视频解决方案相结合
会议一直是我们在商业世界中沟通方式的核心部分。然而,近年来混合和远程工作实践的兴起改变了我们联系和协作的方式。视频和网络会议工具已成为数字劳动力的中流砥柱,使企业领导者能够以前所未…
-
塔塔通信发布 “JAMVEE “云通话解决方案
塔塔通信(Tata Communications) 发布了基于云的“JAMVEE”呼叫解决方案,以增强员工体验和生产力。 JAMVEE 为用户提供语音通话、消息传递和协作功能,可在…
-
RingCentral推出用于增强商业通信的突破性AI平台RingSense
加州贝尔蒙特–(BUSINESS WIRE)–人工智能驱动的全球企业云通信、视频会议、协作和联络中心解决方案的领先供应商RingCentral, Inc.(…
-
从 ISE 到 NAB 看 2023年音视频行业趋势:沉浸式、IP 和远程工作方面的创新
正如 ISE2023 所证明的那样,面对面的活动重新流行起来,该节目报告了在巴塞罗那标志性的 Fira 中心(从阿姆斯特丹搬迁后的新场地)第一天举办的活动记录。在 NAB2023 …
-
Mirrorscape 与高通合作,为 AR 眼镜带来 AR 游戏平台“ARcana”
2023 年 3 月 28 日,增强现实 (AR) 游戏开发公司 Mirrorscape 今天宣布将与 Qualcomm Technologies, Inc. 合作,在 AR 眼镜…
-
Meta 专利探索在AR/VR环境中的视频通话体验
视频会议已经成为人们联系的一个重要方式。然而,当前的视频通话属于2D表示,所以能够实现进一步临场感的AR/VR成为了行业关注的一个方向。 在名为“Parallel video ca…
-
AIGC技术将掀起算力需求革命,PPIO王闻宇深度剖析对边缘计算的影响
编者按:TGO的《大咖面对面》直播栏目已经播出第四期。今天,我们邀请了两位TGO会员来共同探讨「边缘计算的未来、应用落地与新格局」。TGO致力于让拥有共同话题、背景和认知的人聚集在…
-
Five9将工作流程自动化工具嵌入其CCaaS平台中
Five9 已宣布增强 Five9 工作流自动化 (WFA),现在该解决方案已被列为其所有 CCaaS 用户的标准。 Five9 WFA 的更新包括在外部业务系统和 Five9 联…
-
谷歌 CCaaS 平台新增 Generative AI App Builder,几分钟可构建一个机器人
谷歌已宣布计划将其新的 Generative AI App Builder 嵌入到 Google Contact Center AI 平台中。 App Builder 结合了大型语…
-
虚拟形象带来有趣互动,相芯科技助力碰爪创新社交生态
随着在Z世代走出学校进入社会,他们正成为互联网消费主力军。 他们崇尚个性,喜爱展现自我,社交对象开始从熟人转向陌生人,社交内容也从分享交流转向兴趣爱好。深入挖掘Z时代需求,通过社交…
-
IFRNet:用于高效帧插值的中间特征细化网络
目前流行的视频帧插值算法,从连续的输入产生中间帧,通常依赖于复杂的模型结构,具有沉重的参数或大的延迟,阻碍了它们的实时应用。作者设计了一个高效的基于编码器-解码器的网络,称为 IF…