大厂Animal
-
干货分享:Cocos Creator 编辑器技术架构与实践
Cocos Creator 的编辑器从立项之初便坚定地在前端技术栈上进行投入,目前已积累了大量业界领先的底层经验。这些底层设计支撑着更上层的框架及业务层开发,一方面满足 Cocos…
-
网易伏羲获得NeurIPS MineRL BASALT竞赛冠军,背后技术竟然是它?
近日,一项以拟人化为目标的人工智能竞赛NeurIPS 2022 MineRL BASALT Competition公布了最终结果,网易伏羲凭借在所有竞赛任务上的出色表现,在历时三个…
-
淘宝人生专属“小屋”——虚拟人和虚拟场景技术探索
本文将分享来自淘宝人生团队齐力打造的新玩法——“人生小屋”背后的技术方案,详细介绍如何使用3D渲染引擎从0到1搭建虚拟场景、控制虚拟角色、实现人景交互、优化渲染效果等。笔者在其中主…
-
Compression for AGI(大语言模型进行无损压缩)
摘要:在本次演讲中,我们讨论了基础模型如何开始验证 70 多年前形成的假设:更好地压缩源数据的统计模型最终会从中学习更多基础和通用功能。我们首先介绍压缩的一些基础知识,然后描述跨越…
-
HDFS EC在B站的实践
1.背景 随着B站业务的高速发展,业务产生的数据每天以PB级的速度持续增长,之前主要应对方法是分析数据的使用频率,把数据分为热冷俩类数据,对冷数据进行高密存储来降低存储成本,以及对…
-
ICASSP2023 通用会议理解及生成挑战(MUG)成功举办及获奖团队结果分析
近日,ICASSP2023 通用会议理解及生成挑战(MUG)完成了测试集评测及结果公布,并举办了线上完赛沙龙。本次挑战由ModelScope魔搭社区、阿里巴巴达摩院语音实验室、阿里…
-
Gstreamer中的视频处理与硬件加速
编者按:Gstreamer作为一个比较流行的开源多媒体框架,其优秀的架构使其具有高度的模块化和良好的扩展性,并具有广泛的应用前景。LiveVideoStackCon2022上海站大…
-
CVPR 2023|快手视频质量评估算法被顶会收录
计算机视觉领域顶级会议Computer Vision and Pattern Recognition Conference(CVPR 2023)将于6月18日至22日在加拿大温哥华…
-
MRCP在美团语音交互中的实践和应用
当你和智能语音机器人对话交互时,你是否好奇电话背后的机器人如何“听懂”你的意思,又如何像人一样“回答”你的问题?其中比较重要的技术就是 MRCP。本文主要介绍了 MRCP 在美团语…
-
WeSpeaker支持C++部署链路
WeSpeaker正式更新C++部署链路,推理引擎使用OnnxRuntime,支持从语音中提取Speaker Embedding信息,代码详见WeSpeaker/runtime[1…
-
B站语音识别技术的落地实践
自动语音识别(Automatic Speech Recognition,ASR)技术目前已大规模落地于B站相关业务场景,例如音视频内容安全审核,AI字幕(C端,必剪,S12直播等)…
-
云游戏音视频体验优化实践
编者按:从2019年开始,云游戏的热度迅速上升,云游戏平台如雨后春笋般出现。然而,目前还未出现一个影响力大的标志性平台,并且大家对云游戏的预期与云游戏的真实现状有出入。那么,如何才…
-
WebRTC 中 WebSocket 的使用
1. WebSocket 概念 WebSocket 是一种在单个 TCP 连接上进行全双工通信的网络协议。意为:经过一次 TCP 握手就可以直接创建持久性连接,进而可实现服务端和客…
-
美团视觉GPU推理服务部署架构优化实践
面对在线推理服务使用的GPU资源不断增加、GPU利用率普遍较低的挑战,美团视觉研发团队决定通过模型结构拆分和微服务化进行优化,他们提出了一种通用高效的部署架构,来解决这种常见的性能…
-
通过 AI 和加速计算推动 5G 时代的创新
电信行业在推动整个社会的数字化转型方面一直发挥着举足轻重的作用。一个多世纪以来,从固定通信到移动通信,该行业孵育了连接全人类的技术。随着 5G 时代的到来,电信行业会起到更多关键作…
-
今天,我想去一个平行世界
2023的开年爆款,非《流浪地球2》莫属。 它展开了人类的新话题,关于平行空间,关于数字生命,关于人类文明。跟随这部科幻巨作,穿越平行空间,领略前所未有的真实视觉震撼;认知数字意识…
-
视频卡顿有延迟?海事卫星加上TA,“船岸互通”不再难!
“我们在红海,下红海行动,下了3天,我们都不如自己去行动”。说起海上的网速,脱口秀演员毛豆这样调侃。 毛豆曾是一名海军炊事员。听他说,船上偶尔会组织集体观影活动,给长时间的海上航行…
-
3D全景沉浸式体验场景未来城质量保障方案总结
未来城是淘宝探索下一代互联网电商在3D场景中的创新尝试,借助了云端强大的GPU完成高清复杂的场景渲染,实现3A影视级画面,端到端200ms时延,用户无需下载大型的安装包,就可在淘宝…
-
世界杯直播 | 抖音视频编码器优化
世界杯的编码技术挑战 对于世界杯这样的大型体育赛事而言,视频编码算法既要在高速运动、复杂纹理的场景下确保直播内容的清晰度和流畅度,保障用户的观赛体验,又要兼顾码率、延迟等对网络传输…
-
海量并发低延时 RTC-CDN 系统架构设计(下)
导读:随着近几年音视频流媒体行业的持续发展,海量并发、低延时和低成本作为三大核心诉求依旧需要不断深挖,同时随着 RTC 和 CDN 这两种技术的界线越来越模糊,因此有必要从底层架构…