大厂Animal认证作者
-
哔哩哔哩直播通用奖励系统揭秘
本文将介绍 B 站直播奖励系统的技术架构,从需求分析到实现细节,全面解析其背后的技术方案。
-
结合YOLOv8和OpenCV WeChat QRCode打造一款二维码识别器
二维码(QR Code)在现代生活中有广泛应用,从支付系统到信息传递,它们无处不在。本文提出了一种如何识别二维码的方法,主要贡献在于优化处理分辨率较高的图像时,由于二维码在整张图片…
-
WavTokenizer:重新定义音频压缩的突破性声学编解码器模型
大规模语言模型在涉及多发言人语音合成、音乐生成和音频生成的生成任务中取得了重大进展。将语音模态集成到多模态统一大型模型中也变得流行起来,例如 SpeechGPT 和 AnyGPT …
-
用多模态技术在多媒体系统中实现场景分类
本文研究了多模态算法在多媒体系统中进行场景分类的应用,探讨了实施过程中的挑战并给出对应的解决方案。
-
低延时直播系统在欧洲杯的实践
欧洲杯作为全球关注的足球赛事之一,实时、清晰的观赛体验对球迷至关重要,当画质清晰度接近的情况下延时的权重就会被放大。随着新技术如5G、云计算等的发展,低延时直播技术得到提升,也引发…
-
触摸未来,字节跳动提出6DoF直播创新方案
在通信技术的浪潮中,我们见证了媒体技术的一步步演进,每一步的跨越,都不仅仅是技术的升级,更是人类感知世界方式的一次飞跃。从一维时代电话的只闻其声不见其人,到二维时代视频的闻其声也见…
-
B站:自研点直播转码核心
1. 背景 视频转码是将视频文件经过解封装、解码、滤镜处理、编码、封装从而转换为另一个视频文件的过程,B站每天都有大量的视频原片上传后经过转码系统转换为多个不同分辨率。转换后的视频…
-
得物App弱网诊断探索之路
一 背景 随着得物用户规模和业务复杂度不断提升,端上网络体验优化已逐步进入深水区。为了更好地保障处于弱网状态下得物App用户的使用体验,我们在已有的网络体验大盘、网络诊断工具的基础…
-
图解Kafka:架构设计、消息可靠、数据持久、高性能背后的底层原理
在构建高吞吐量和高可靠性的消息系统时,Apache Kafka 成为了众多程序员的首选。本文深入剖析了 Kafka 的内部机制,从宏观架构到消息流转的细节,揭示了 Kafka 如何…
-
京东.Vision首登苹果Vision Pro 背后的技术探索
随着Apple Vision Pro 6月28日在国内正式上市,京东.Vision作为国内首批发布的Vision Pro应用与用户见面,基于空间计算技术,提供了一种全新的沉浸式购物…
-
点播CDN回源标准化策略
分享来自哔哩哔哩业务线的文章《点播CDN回源标准化策略》。 一、背景&问题: 背景: 问题: 二、点播回源架构的策略变化和演变: 1、点播回源故障具体案例和反思 多厂商专线…
-
开源上新|FunASR离线文件转写GPU软件包1.0
FunASR是由通义实验室开源的语音识别框架,集成了语音端点检测、语音识别、标点预测等领域的工业级模型的训练和部署,自开源以来,吸引了众多开发者参与体验和开发。为了支持用户便捷高效…
-
视频剪辑中的色彩空间
1. 前言 查看视频文件中对颜色的描述,使用ffprobe指令:ffprobe -i 视频文件地址 -show_streams,有打印如下颜色相关的信息: 以上参数表示:视频的色彩…
-
视频云沉浸式音视频技术能力探索与建设
随着传输技术、显示技术与算力的持续提升,用户对于音视频体验的需求在提高,各家设备厂商也在探索和推出对应的技术与产品。打造空间感的空间视频与空间音频是其中最为关键的2项技术,bili…
-
斩获 CVPR NTIRE 冠亚军,小红书如何提升短视频与直播体验质量?
近日,CVPR NTIRE 2024 Challenges[1] 各赛道相继公布比赛结果,小红书音视频架构团队图像算法组在两项重要竞赛中斩获冠、亚军。 其中,他们主导参与 Rest…
-
火山引擎联合中国科学技术大学IMCL团队夺得NTIRE大赛盲压缩图像增强赛道冠军
近日,第2024届CVPR Workshop下属的NTIRE大赛公布比赛结果,在盲压缩图像增强赛道,火山引擎多媒体实验室联合中国科学技术大学智能媒体计算实验室(IMCL)团队自主研…
-
Android framework的GPU调频
AI时代已经来临,在日益增长的算力需求下,GPU已经成为AI世界不可或缺的工具,而移动端高渲染高帧应用也对移动端GPU提出越来越高的要求,本文将以高通的adreno gpu为例对G…
-
抖音“BDVQAGroup”获得 DXOMARK 图像质量评估挑战赛全球第二 | CVPR 2024
近期,在计算机视觉领域最具影响力的「国际竞赛 CVPR 2024 NTIRE」中,抖音基础体验QA团队与AI 平台团队同学组成的“BDVQAGroup”小组,在 DXOMARK的图…
-
AIGC生图的自动化质量评估
AIGC生图需要进行质量评估以确保满足一定标准。这一评估过程非常重要,因其关系到内容的专业性、商业价值以及顾客的满意度。然而,传统的手动评估方式既耗时又耗力,且容易受到主观偏差的影…
-
淘宝短视频流工程重构(上):理论篇
随着视频流业务的发展,业务的复杂性越来越高,视频流老工程在架构设计、代码质量、工程能力等方面的问题也逐渐凸显。在这样的背景下我们开启了一次对老工程的大型重构。 本次重构是一次对大型…