大厂Animal
-
腾讯云V265/TXAV1直播场景下的编码优化和应用
编者按:随着视频直播不断向着超高清、低延时、高码率的方向发展, Apple Vision的出现又进一步拓展了对3D, 8K 120FPS的视频编码需求,视频的编码优化也变得越来越具…
-
近实时智能应答 2D 数字人搭建
早在大语言模型如 GPT-3.5 等的兴起和被日渐广泛地采用之前,教育行业已经在 AI 辅助教学领域有过各种各样的尝试。在教育行业,人工智能技术的采用帮助教育行业更好地实现教学目标…
-
画质提升+带宽优化,小红书音视频团队端云结合超分落地实践
随着视频业务和短视频播放规模不断增长,小红书一直致力于研究:如何在保证提升用户体验质量的同时降低视频带宽成本? 在近日结束的音视频技术大会「LiveVideoStackCon 20…
-
NTIRE 2023| 快手荣获Stereo Image Super-Resolution竞赛Winner Award
近日,快手在全球顶级图像处理竞赛NTIRE 2023的Stereo Image Super-Resolution竞赛中荣获Winner Award。该竞赛赛道一共有175支参赛队伍…
-
从0到1:哔哩哔哩智能客服系统的设计与实现
1 背景 1.1 为什么要做新系统 B站过去的客服系统是通过外部采购获得的,已经使用了几年。然而,这个外购的系统存在一系列问题: 虽然曾考虑过采购新的客服系统,但也面临…
-
腾讯多媒体实验室助力国内首个「4K+60fps」云游戏落地START
导语 据中国信息通信研究院发布的《全球云游戏产业深度观察及趋势研判研究报告(2023年)》,2022年中国云游戏月活人数已达到8410万人,市场收入超63亿元人民币,云游…
-
华为云MetaStudio多模态数字人进展及挑战介绍
编者按:数字人作为AI能力集大成者,涉及计算机视觉、计算机图形学、语音处理、自然语言处理等技术,正在金融、政务、传媒、电商等领域应用越来越广。LiveVideoStackCon 2…
-
MediaUni——面向未来的流媒体传输网络设计与实践
“立足当下,着眼未来”,任何一位从业者都应该谨遵这样的格言。阿里云通过总结这么多年的流媒体传输服务,分析痛点、提出措施、改进技术、认真思考,带来了MediaUni这样一个面向未来的…
-
BILIVVC编码器首次亮相MSU国际视频编码器大赛并获得多项好成绩
2023年7月14日,2022年度MSU编码器大赛结果揭晓,哔哩哔哩自研的VVC编码器BILIVVC首次参加比赛,在1080p 1fps和5fps档位均取得了YUV-SSIM性能综…
-
超低延迟开实体赛车、用算法解放G力上限?这个团队真的很大胆
Unity 不仅能应用在传统游戏开发领域,还可通过强大的 XR 渲染技术与超低延迟技术(RTE)相结合,带来突破虚实边界的新型娱乐体验。 “光子赛车”团队具有跨行业背景,从工业数字…
-
B站幻星数字人3D渲染技术揭秘
一 幻星数字人简介 幻星数字人是天工制作部联合人工智能平台部虚拟人算法组打造的3D数字人解决方案,主要由工业化数字人智能生成管线+AI驱动的表情与动作捕捉系统两部分构成。如上图所示…
-
详解rocketMq通信模块&升级构想
本文从开发者的角度深入解析了基于netty的通信模块, 并通过简易扩展实现微服务化通信工具雏形, 适合于想要了解netty通信框架的使用案例, 想了解中间件通信模块设计, 以及微服…
-
MSU编码大赛放榜丨腾讯Tencent266斩获12项第一,压缩性能行业领先
近日公布的MSU FullHD编码大赛结果中,腾讯编码器包揽所有15项关键指标全部第一。腾讯自研的最新一代视频编解码标准VVC/H.266编码器Tencent266,以出色的压缩性…
-
SIGIR 2023 | 发布业内首个语音对话推荐数据集!火山语音团队实力助推VCRS发展
近年来,推荐系统在工业界取得了巨大成功,甚至成为互联网发展中不可或缺的增长引擎,基于此研究者们也在积极探索推荐系统的新形态,其中对话推荐系统(Conversational Reco…
-
B站虚拟人与动作捕捉技术
随着虚拟开播在B站等平台的火爆,越来越多的用户和主播对虚拟直播产生了浓厚的兴趣。3D写实风格的虚拟人不仅视觉效果出众,还能提供沉浸式的直播体验,为用户带来全新的观看感受。如抖音推出…
-
MABIM:多智能体强化学习算法的“炼丹炉”
编者按:现实世界中,许多问题和任务都是由多个参与者交互进行的,所以要想使用人工智能技术解决真实世界的问题,就需要更好地模拟这种复杂的环境,而这正是多智能体强化学习(MARL)的强项…
-
ACL 2023 | 持续进化中的语言基础模型
尽管如今的 AI 模型已经具备了理解自然语言的能力,但科研人员并没有停止对模型的不断改善和理论探索。自然语言处理(NLP)领域的技术始终在快速变化和发展当中,酝酿着新的潮流和突破。…
-
百度iOS端长连接组件建设及应用实践
在过去的十年里,移动端技术飞速发展,移动应用逐渐成为主要的便捷访问和使用互联网的方式,承接了越来越多的业务和功能,这也意味着对移动端和服务器之间的通信效率和稳定性提出了更高的要求。…
-
分布式UUID的生成策略及应用场景浅析
UUID是国际标准化组织(ISO)提出的一个概念。UUID用来识别属性类型,在所有空间和时间上被视为唯一的标识。本文将从UUID的构成方式、现行版本、生成策略、应用案例等方面作介绍…
-
多模态算法在AIGC视频生成中的应用
随着抖音、快手、B站等视频平台的崛起,视频内容正占据着用户越来越多的时间。对于各个平台来说,内容视频化趋势明显。对于之家来说,也需要尽快完成在该赛道的技术工作。对于AIGC视频生成…