大厂Animal
-
KBS 2022|基于多视角子空间学习的 RGB-D 情绪识别
简介:多视角子空间学习(Multiview subspace learning, MSL)已广泛应用于各种实际应用,包括情绪识别。尽管 MSL 取得许多进展,仍有两个挑战需要解决。…
-
5G语音方案的三个阶段
5G时代,实时通信仍然是不可或缺的基本业务能力。5G发展至今,已经从基础建设期进入了加速发展期,那么5G语音现在什么样了? 在5G SA架构下,5G语音方案包含三个阶段: EPS …
-
腾讯云音视频与FFmpeg开源生态
自由与开源软件的理念,从不解、争议、接受到如今如火如荼,经历了长期的历程。国内开源软件起步较晚,但进展迅速。腾讯经过几年的开源协同运动,也取得了不少成绩。其中,腾讯云音视频在FFm…
-
基于无服务器架构的通信空间大数据GIS性能研究
摘要:给出了通信空间大数据场景下Serverless架构设计方案,该方案将WebGIS技术、Serverless架构相结合,采用SSR后端渲染技术构建前端项目,以支持同构代码的服务…
-
云游戏场景网络切片生命周期管理研究
摘要:5G网络的端到端切片进一步提高了网络传输速度,降低了网络延迟,成为普及云游戏服务的关键因素。云游戏网络切片的整体管理需要结合云游戏行业的具体特点进行深入研究。针对云游戏行业应…
-
干货分享:Cocos Creator 编辑器技术架构与实践
Cocos Creator 的编辑器从立项之初便坚定地在前端技术栈上进行投入,目前已积累了大量业界领先的底层经验。这些底层设计支撑着更上层的框架及业务层开发,一方面满足 Cocos…
-
网易伏羲获得NeurIPS MineRL BASALT竞赛冠军,背后技术竟然是它?
近日,一项以拟人化为目标的人工智能竞赛NeurIPS 2022 MineRL BASALT Competition公布了最终结果,网易伏羲凭借在所有竞赛任务上的出色表现,在历时三个…
-
淘宝人生专属“小屋”——虚拟人和虚拟场景技术探索
本文将分享来自淘宝人生团队齐力打造的新玩法——“人生小屋”背后的技术方案,详细介绍如何使用3D渲染引擎从0到1搭建虚拟场景、控制虚拟角色、实现人景交互、优化渲染效果等。笔者在其中主…
-
Compression for AGI(大语言模型进行无损压缩)
摘要:在本次演讲中,我们讨论了基础模型如何开始验证 70 多年前形成的假设:更好地压缩源数据的统计模型最终会从中学习更多基础和通用功能。我们首先介绍压缩的一些基础知识,然后描述跨越…
-
HDFS EC在B站的实践
1.背景 随着B站业务的高速发展,业务产生的数据每天以PB级的速度持续增长,之前主要应对方法是分析数据的使用频率,把数据分为热冷俩类数据,对冷数据进行高密存储来降低存储成本,以及对…
-
ICASSP2023 通用会议理解及生成挑战(MUG)成功举办及获奖团队结果分析
近日,ICASSP2023 通用会议理解及生成挑战(MUG)完成了测试集评测及结果公布,并举办了线上完赛沙龙。本次挑战由ModelScope魔搭社区、阿里巴巴达摩院语音实验室、阿里…
-
Gstreamer中的视频处理与硬件加速
编者按:Gstreamer作为一个比较流行的开源多媒体框架,其优秀的架构使其具有高度的模块化和良好的扩展性,并具有广泛的应用前景。LiveVideoStackCon2022上海站大…
-
CVPR 2023|快手视频质量评估算法被顶会收录
计算机视觉领域顶级会议Computer Vision and Pattern Recognition Conference(CVPR 2023)将于6月18日至22日在加拿大温哥华…
-
MRCP在美团语音交互中的实践和应用
当你和智能语音机器人对话交互时,你是否好奇电话背后的机器人如何“听懂”你的意思,又如何像人一样“回答”你的问题?其中比较重要的技术就是 MRCP。本文主要介绍了 MRCP 在美团语…
-
WeSpeaker支持C++部署链路
WeSpeaker正式更新C++部署链路,推理引擎使用OnnxRuntime,支持从语音中提取Speaker Embedding信息,代码详见WeSpeaker/runtime[1…
-
B站语音识别技术的落地实践
自动语音识别(Automatic Speech Recognition,ASR)技术目前已大规模落地于B站相关业务场景,例如音视频内容安全审核,AI字幕(C端,必剪,S12直播等)…
-
云游戏音视频体验优化实践
编者按:从2019年开始,云游戏的热度迅速上升,云游戏平台如雨后春笋般出现。然而,目前还未出现一个影响力大的标志性平台,并且大家对云游戏的预期与云游戏的真实现状有出入。那么,如何才…
-
WebRTC 中 WebSocket 的使用
1. WebSocket 概念 WebSocket 是一种在单个 TCP 连接上进行全双工通信的网络协议。意为:经过一次 TCP 握手就可以直接创建持久性连接,进而可实现服务端和客…
-
美团视觉GPU推理服务部署架构优化实践
面对在线推理服务使用的GPU资源不断增加、GPU利用率普遍较低的挑战,美团视觉研发团队决定通过模型结构拆分和微服务化进行优化,他们提出了一种通用高效的部署架构,来解决这种常见的性能…
-
通过 AI 和加速计算推动 5G 时代的创新
电信行业在推动整个社会的数字化转型方面一直发挥着举足轻重的作用。一个多世纪以来,从固定通信到移动通信,该行业孵育了连接全人类的技术。随着 5G 时代的到来,电信行业会起到更多关键作…