大厂Animal
-
MABIM:多智能体强化学习算法的“炼丹炉”
编者按:现实世界中,许多问题和任务都是由多个参与者交互进行的,所以要想使用人工智能技术解决真实世界的问题,就需要更好地模拟这种复杂的环境,而这正是多智能体强化学习(MARL)的强项…
-
ACL 2023 | 持续进化中的语言基础模型
尽管如今的 AI 模型已经具备了理解自然语言的能力,但科研人员并没有停止对模型的不断改善和理论探索。自然语言处理(NLP)领域的技术始终在快速变化和发展当中,酝酿着新的潮流和突破。…
-
百度iOS端长连接组件建设及应用实践
在过去的十年里,移动端技术飞速发展,移动应用逐渐成为主要的便捷访问和使用互联网的方式,承接了越来越多的业务和功能,这也意味着对移动端和服务器之间的通信效率和稳定性提出了更高的要求。…
-
分布式UUID的生成策略及应用场景浅析
UUID是国际标准化组织(ISO)提出的一个概念。UUID用来识别属性类型,在所有空间和时间上被视为唯一的标识。本文将从UUID的构成方式、现行版本、生成策略、应用案例等方面作介绍…
-
多模态算法在AIGC视频生成中的应用
随着抖音、快手、B站等视频平台的崛起,视频内容正占据着用户越来越多的时间。对于各个平台来说,内容视频化趋势明显。对于之家来说,也需要尽快完成在该赛道的技术工作。对于AIGC视频生成…
-
MSU2022|快手SL200芯片夺得16项第一!
7月5日,由莫斯科国立大学举办的MSU2022世界编码器大赛硬件编码器成绩全部揭晓。快手StreamLake首款自研智能视频处理芯片StreamLake – 200(后…
-
RTC 场景下的视频编码优化与 AI 超分结合实践
7 月 1 日下午,在北京·新云南皇冠假日酒店,由稀土掘金技术社区举办的 「稀土开发者大会2023」,网易云信视频编解码算法专家苗晋伟受邀出席【音视频技术前沿】专场演讲,他在本次大…
-
从0到1!得物如何打造通用大模型训练和推理平台
1 背景 近期,GPT大模型的发布给自然语言处理(NLP)领域带来了令人震撼的体验。随着这一事件的发生,一系列开源大模型也迅速崛起。依据一些评估机构的评估,这些开源模型大模型的表现…
-
AI Image Codec技术落地实践
AI Codec自2016年首次提出以来,众多海内外高校、企业研究院等机构对此展开了广泛研究。6年时间里,AI Codec 的SOTA方案的压缩性能已经超越了H.266(最新的传统…
-
Web 工程化:使用 Babel 实现前端日志无痕插桩
身为一名开发人员,日志对大家一定不陌生,不管是平时开发的错误警告,还是发现线上问题后的快速定位,都离不开日志的帮助,甚至我们可以通过日志来分析用户的行为,优化产品设计和业务流程.在…
-
直播 RTM 推流在抖音的应用与优化
背景 随着互联网技术以及网络基建的快速发展和普及,视频直播已经成为了一种越来越普遍的娱乐和社交方式。无论是个人还是企业,都可以通过视频直播平台进行直播活动,向观众展示自己的生活、工…
-
字节跳动提出高性能 transformer 推理库,获 IPDPS 2023 最佳论文奖
字节跳动与英伟达, 加州大学河滨分校联合发表的论文 《ByteTransformer: A High-Performance Transformer Boosted for Var…
-
聊聊做 NeRF-3D重建性能优化经历
本文作者尘漠加入大淘宝到现在也有5年了,一路走来很开心,他认为在这里可以让他静心做技术研究。以下是尘漠的自述—— 在淘宝前三年,我主要偏向研究 2d计算机视觉算法,相比于研究GAN…
-
自研算法提升文本图像篡改检测精度,抖音技术团队获 ICDAR2023 分类赛道冠军
近日,抖音 CV 技术团队在 ICDAR 2023 的“Detecting Tampered Text in Images”比赛中,利用自研的“CAS”算法从 1267 个参赛队伍…
-
对话钉钉音视频专家冯津伟:大模型不是万能的
在音视频技术领域,ICASSP 大会是行业的风向标会议,也是语音学界从业者研究下一代技术发展的盛宴。近期,国内外各大企业陆陆续续放出论文入顶会的消息,钉钉蜂鸣鸟音频实验室 2 篇论…
-
淘宝拍照基于端云协同的视频流实时搜索实践
本文介绍了实时视频流的主体识别场景,未来实时搜将会融合图搜主链路并在XR场景发力,未来的场景我们取名为“元视界”(MetaSight)。 作者:绍楠、素流来源:大淘宝技术 引言 很…
-
ACL 2023 发榜!火山语音推出业内首个借助视频信息的端到端语音翻译模型
日前 ACL 2023的论文录用结果公布,火山语音团队多篇论文成功入选,内容涵盖音频合成、歌声合成以及语音翻译等多个前沿技术领域的创新突破。ACL(Annual Meeting o…
-
Web 端实时防挡脸弹幕(基于机器学习)
防挡脸弹幕,即大量弹幕飘过,但不会遮挡视频画面中的人物,看起来像是从人物背后飘过去的。 机器学习已经火了好几年了,但很多人都不知道浏览器中也能运行这些能力; 本文介绍在视频弹幕方面…
-
强化学习驱动的低延迟视频传输
随着视频会议、视频直播的流行以及未来AR/VR业务的发展,低延迟视频传输服务被广泛使用,但视频质量(QoE)还不能满足用户要求。那么近年来新兴的AI神经网络是否能为视频传输带来智能…
-
让文物“活”起来,火山引擎视频云三维重建技术揭秘
中国历史悠久,文化底蕴深厚,文物数目众多,文物作为前人智慧的结晶,其文献价值不言而喻。古籍是记录中华文明的重要载体,也是流传至今的宝贵文化遗产,文物保护也是一项长期重要的基础工作。…