

大厂Animal认证作者
-
B站:面向规模化的视频数字水印解决方案
在线视频领域的繁荣离不开创作者在内容生产环节的辛勤耕耘。视频既是信息得以高速传播的有效载体,也是创作者的劳动成果,本质上也是一种虚拟资产。随着版权意识的崛起,越来越多的创作者和观众…
-
如何利用播放器节省20%点播成本
点播成本节省的点其实涉及诸多部分,例如:CDN、转码、存储等,而利用播放器降本却是很多客户比较陌生的部分。火山引擎基于内部支撑抖音集团相关业务的实践,播放器恰恰是成本优化中最重要和…
-
边缘计算的一体化调度方案探索
Labs 导读:随着近些年VR、AR、物联网等技术的发展和推广,VR头显设备、物联网终端设备等瘦客户端的算力不足问题越发凸显,面对用户终端算力不足的问题,很多厂商都选择利用云计算来…
-
三分钟,带你了解下一代传输层协议QUIC
QUIC(Quick UDP Internet Connection,快速UDP网络连接)发音同 “quick”,是 Google 公司在 2012 年提出…
-
社交直播多级缓存一致性解决方案-缓存管道
背景介绍 1. 2021年开始,社交直播活动中台因为需要支持的产品越来越多,优化过程中发现对于很多读场景来说中心缓存的读取已经成为了性能瓶颈,所以大量业务场景 开始采取二级缓存方案…
-
大规模流量下的云边端一体化流量调度体系
火山引擎是字节跳动旗下的云服务平台, 将字节跳动快速发展过程中积累的增长方法、技术能力和工具开放给外部企业,提供云基础、视频与内容分发、数智平台VeDI、 人工智能、开发与运维等服…
-
生成式 AI 入门难?速来解锁这份生成式 AI 词汇表(上篇)
近年来,生成式 AI 如雨后春笋般迅速兴起,很多开发者对其中涉及的新兴技术概念还并不熟悉。 然而对于在 AI 和机器学习行业工作的开发者来说,他们一直都处于学习的状态(无论是开发者…
-
音视频质检及画质评估——为QoS & QoE 指标保驾护航
腾讯已有超过21年的音视频技术积累,独家具备 RT-ONE 全球网络。此外,构建了包括实时音视频、云直播、云点播、即时通信、媒体处理等业界最完整的 PaaS 及 aPaaS 产品家…
-
音画同步测试方法的研究与实践
导读:音视频通话中的音画同步问题一直是一个重要的挑战。传统的主观测试方法往往受到主观因素的影响,难以准确评估音画同步的质量。为了解决这个问题,针对业界已有的客观测试方法做了一定研究…
-
Interspeech 2023 | 火山引擎流媒体音频技术之语音增强和AI音频编码
背景介绍 作为语音信号处理研究领域的旗舰国际会议,Interspeech一直代表着声学领域技术最前沿的研究方向,Interspeech 2023 收录了多篇和音频信号语音增强算法相…
-
基于对比学习的一体化模型 | Interspeech2023
导读:Interspeech 是国际语音通信协会(ISCA)举办的年度会议,也是全球最大、最全面的专注于语音通信领域的学术盛会。2023 届 Interspeech 会议于 202…
-
适用于多语言 ASR 的语种路由专家混合模型 | Interspeech 2023
导读:Interspeech 是国际语音通信协会(ISCA)举办的年度会议,也是全球最大、最全面的专注于语音通信领域的学术盛会。2023 届 Interspeech 会议于 202…
-
金山云直播架构演进及边缘计算场景探索
编者按:在视频云升级、直播行业走向成熟的大背景下,金山云如何通过整合边缘云和相关计算能力,保持在行业的重要位置?LiveVideoStack 2023上海站邀请到金山云的朱岩老师,…
-
支持AI视频处理的高容量流媒体加速卡方案
编者按: 实况直播业务随着流媒体市场的发展增长迅速。与传统流媒体“一对多”的模式不同,直播流媒体高交互的特性和 “多对多”的架构对时延的要求越来越高,传统基础设施部署和硬件已经不能…
-
华为云渲染实践:从2D图形到3D空间
编者按:云计算与网络基础设施发展为云端渲染提供了更好的发展机会,华为云随之长期在自研图形渲染引擎、工业领域渲染和AI加速渲染三大方向进行云渲染方面的探索与研究。本次LiveVide…
-
腾讯视频「智臻」系列 – AI终端实时超分正式上线
导语:7月3日,腾讯视频发布画质增强功能,为提升腾讯视频基础画质,改善用户消费体验,腾讯视频联合多媒体实验室、微信打造了移动端终端实时超分方案,对480P基础档位提供实时画质增强能…
-
基于动作敏感性学习的时序动作定位 | ICCV2023
淘天集团-内容理解算法团队与浙江大学杨易教授团队合作的关于视频时序定位的论文被ICCV2023录取。 本文在业界首次将视频帧级别的细粒度信息引入至时序动作定位领域(Temporal…
-
腾讯云V265/TXAV1直播场景下的编码优化和应用
编者按:随着视频直播不断向着超高清、低延时、高码率的方向发展, Apple Vision的出现又进一步拓展了对3D, 8K 120FPS的视频编码需求,视频的编码优化也变得越来越具…
-
近实时智能应答 2D 数字人搭建
早在大语言模型如 GPT-3.5 等的兴起和被日渐广泛地采用之前,教育行业已经在 AI 辅助教学领域有过各种各样的尝试。在教育行业,人工智能技术的采用帮助教育行业更好地实现教学目标…
-
画质提升+带宽优化,小红书音视频团队端云结合超分落地实践
随着视频业务和短视频播放规模不断增长,小红书一直致力于研究:如何在保证提升用户体验质量的同时降低视频带宽成本? 在近日结束的音视频技术大会「LiveVideoStackCon 20…