大厂Animal
-
MSU2022|快手SL200芯片夺得16项第一!
7月5日,由莫斯科国立大学举办的MSU2022世界编码器大赛硬件编码器成绩全部揭晓。快手StreamLake首款自研智能视频处理芯片StreamLake – 200(后…
-
RTC 场景下的视频编码优化与 AI 超分结合实践
7 月 1 日下午,在北京·新云南皇冠假日酒店,由稀土掘金技术社区举办的 「稀土开发者大会2023」,网易云信视频编解码算法专家苗晋伟受邀出席【音视频技术前沿】专场演讲,他在本次大…
-
从0到1!得物如何打造通用大模型训练和推理平台
1 背景 近期,GPT大模型的发布给自然语言处理(NLP)领域带来了令人震撼的体验。随着这一事件的发生,一系列开源大模型也迅速崛起。依据一些评估机构的评估,这些开源模型大模型的表现…
-
AI Image Codec技术落地实践
AI Codec自2016年首次提出以来,众多海内外高校、企业研究院等机构对此展开了广泛研究。6年时间里,AI Codec 的SOTA方案的压缩性能已经超越了H.266(最新的传统…
-
Web 工程化:使用 Babel 实现前端日志无痕插桩
身为一名开发人员,日志对大家一定不陌生,不管是平时开发的错误警告,还是发现线上问题后的快速定位,都离不开日志的帮助,甚至我们可以通过日志来分析用户的行为,优化产品设计和业务流程.在…
-
直播 RTM 推流在抖音的应用与优化
背景 随着互联网技术以及网络基建的快速发展和普及,视频直播已经成为了一种越来越普遍的娱乐和社交方式。无论是个人还是企业,都可以通过视频直播平台进行直播活动,向观众展示自己的生活、工…
-
字节跳动提出高性能 transformer 推理库,获 IPDPS 2023 最佳论文奖
字节跳动与英伟达, 加州大学河滨分校联合发表的论文 《ByteTransformer: A High-Performance Transformer Boosted for Var…
-
聊聊做 NeRF-3D重建性能优化经历
本文作者尘漠加入大淘宝到现在也有5年了,一路走来很开心,他认为在这里可以让他静心做技术研究。以下是尘漠的自述—— 在淘宝前三年,我主要偏向研究 2d计算机视觉算法,相比于研究GAN…
-
自研算法提升文本图像篡改检测精度,抖音技术团队获 ICDAR2023 分类赛道冠军
近日,抖音 CV 技术团队在 ICDAR 2023 的“Detecting Tampered Text in Images”比赛中,利用自研的“CAS”算法从 1267 个参赛队伍…
-
对话钉钉音视频专家冯津伟:大模型不是万能的
在音视频技术领域,ICASSP 大会是行业的风向标会议,也是语音学界从业者研究下一代技术发展的盛宴。近期,国内外各大企业陆陆续续放出论文入顶会的消息,钉钉蜂鸣鸟音频实验室 2 篇论…
-
淘宝拍照基于端云协同的视频流实时搜索实践
本文介绍了实时视频流的主体识别场景,未来实时搜将会融合图搜主链路并在XR场景发力,未来的场景我们取名为“元视界”(MetaSight)。 作者:绍楠、素流来源:大淘宝技术 引言 很…
-
ACL 2023 发榜!火山语音推出业内首个借助视频信息的端到端语音翻译模型
日前 ACL 2023的论文录用结果公布,火山语音团队多篇论文成功入选,内容涵盖音频合成、歌声合成以及语音翻译等多个前沿技术领域的创新突破。ACL(Annual Meeting o…
-
Web 端实时防挡脸弹幕(基于机器学习)
防挡脸弹幕,即大量弹幕飘过,但不会遮挡视频画面中的人物,看起来像是从人物背后飘过去的。 机器学习已经火了好几年了,但很多人都不知道浏览器中也能运行这些能力; 本文介绍在视频弹幕方面…
-
强化学习驱动的低延迟视频传输
随着视频会议、视频直播的流行以及未来AR/VR业务的发展,低延迟视频传输服务被广泛使用,但视频质量(QoE)还不能满足用户要求。那么近年来新兴的AI神经网络是否能为视频传输带来智能…
-
让文物“活”起来,火山引擎视频云三维重建技术揭秘
中国历史悠久,文化底蕴深厚,文物数目众多,文物作为前人智慧的结晶,其文献价值不言而喻。古籍是记录中华文明的重要载体,也是流传至今的宝贵文化遗产,文物保护也是一项长期重要的基础工作。…
-
百度视频质量评测的实践之路
视频编解码技术日新月异,新的编解码技术赋予视频业务新的应用场景和新的用户视听体验。同时,视频作为带宽消耗大户,如何在视听体验和视频带宽之间取得最优的平衡是一个永恒的话题。视频质量评…
-
哔哩哔哩视频云画质与窄带高清AI落地实践
视频赛道卷到下半场,一定会面临体验与成本的对抗,尤其是在行业大环境“过冬”的背景下,想要在有限带宽下获得最佳的画质观感变得异常具备挑战性。从视频云业务场景的视角来看,如何有效解决c…
-
多链路传输技术在火山引擎 RTC 的探索和实践
传统的数据传输方式大多是利用一个链路、选择设备的默认网卡进行传输,使用这种方式实现实时音视频通话时,如果默认网络出现问题(如断网、弱网等),用户的通信就会发生中断或者卡顿,影响用户…
-
vivo互联网视频播放体验优化的探索与实践
随着vivo互联网在视频业务领域的不断扩展,在多样化的业务场景下,如何提升每个用户的视频播放体验,保障最优的播放流畅度和清晰度,vivo互联网技术团队做了很多尝试与突破。LiveV…
-
平行云X火山引擎:探索XR观展的极致体验
5月20日,素有艺术界“奥林匹克”之称的第18届威尼斯国际建筑双年展(以下简称“威尼斯双年展”)中国国家馆展览正式开幕。威尼斯双年展为当今世界规模最大、最具影响力的国际艺术盛事之一…