大厂Animal
-
基于 WebRTC 的大规模直播: 助推直播渗透率与观播时长显著增长 | ACM SIGCOMM’25
本文介绍一项基于实时通信引擎 WebRTC 的大规模极低延时直播技术 RTM,并阐述如何对 RTM进行高效优化,从而实现用户参与度指标(直播渗透率、平均观播时长)的显著增长。
-
快手与清华大学联合提出灵犀系统,重新定义个性化视频体验 | SIGCOMM 2025
本文介绍了一种创新的视频流优化系统:灵犀系统。这是业界首个成功部署在大规模生产环境中、面向用户个性化体验的自适应视频流优化系统。
-
KCP协议应用详解:为速度而生的可靠传输协议
在当今互联网应用中,实时性和流畅性至关重要,尤其是在网络游戏、视频会议和在线直播等场景中。传统的TCP协议虽然提供可靠的数据传输,但其复杂的拥塞控制机制和重传策略会导致较高的延迟,…
-
B站第三代转码体系下流式转码测试实践
B站第三代转码体系下引入了流式转码,以解决同稿件下多条转码任务的重复切片问题、转码临时产物大文件导致的耗时问题,以及非必要的IO和算力开销问题。
-
技术洞察:音频驱动口型生成技术解析 | 咪咕灯塔智库
写在前面:在 AIGC 时代,数字人和影视动画行业快速发展,如何让角色的口型与音频完美同步,成为提升沉浸感的关键技术之一。音频驱动口型生成技术,通过算法将音频信号转化为逼真的唇形动…
-
播放器视频后处理实践(一)
本文将系统介绍我们在播放器视频后处理模块中的技术方案与工程实现,涵盖从效果设计、算法选型,到性能优化和跨平台兼容的全链路细节。
-
如何使用 Amazon Nova Sonic 和 WebSockets 构建完整的语音对话系统
随着人工智能技术的飞速发展,自然语言处理和语音交互技术正在深刻改变人机交互的方式。语音交互正从简单的“机械应答”向更自然的“类人对话”演进。 传统的语音系统通常采用模块化架构,将语…
-
MNN LLM Chat iOS 流式输出优化实践
本文介绍了在 iOS 平台上使用 MNN 框架部署大语言模型(LLM)时,针对聊天应用中文字流式输出卡顿问题的优化实践。通过分析模型输出与 UI 更新不匹配、频繁刷新导致性能瓶颈以…
-
vivo Pulsar 万亿级消息处理实践(4)-Ansible运维部署
Pulsar作为下一代云原生架构的分布式消息中间件,存算分离的架构设计能有效解决大数据场景下分布式消息中间件老牌一哥“Kafka”存在的诸多问题,2021年vivo 分布式消息中间…
-
B站是如何实现原声视频翻译的
BILIBILI Index 团队将系统性地介绍将中文视频翻译为外语的原声风格配音的技术架构与核心挑战,并分享他们在实践中如何逐步实现这些目标。
-
播放器音频后处理实践(一)
本文内容聚焦在两项核心基础音效:重低音和清晰人声。分享两项音效的整体处理流程、关键滤镜链搭建方式、滤波器设计细节,以及如何在保证延迟与功耗可控的前提下,通过 FFmpeg 的 audio filter 机制灵活插拔各类处理节点。
-
哔哩哔哩Android视频编辑页的架构升级
本文介绍了哔哩哔哩Android视频编辑页的架构升级。以轻量化的视频编辑为核心思路,从界面布局、用户交互、已有功能优化、新增必要功能等方面对编辑页进行改版。
-
适配鸿蒙操作系统!腾讯游戏直播SDK基于Kuikly三端一码开发实践
随着鸿蒙Next的发布,越来越多的APP开始推进鸿蒙化适配,产品与技术团队也启动了游戏电竞直播SDK的鸿蒙适配规划。投入足够资源通常能达成适配目标,但仅实现技术目标的意义相对单薄 …
-
使用 AVPlayer 播放 FairPlay DRM 视频的最佳实践
本文介绍使用 AVPlayer 播放 FairPlay DRM 视频的最佳实践。DRM 是指使用加密技术保护视频内容、通过专业技术安全地存储和传输密钥、并允许内容生产商设置商业规则,限制内容观看者的一种系统。
-
技术洞察:浅析6G技术最新进展及对未来音视频行业的影响 | 咪咕灯塔智库
写在前面:随着5G技术的商业化应用逐渐成熟,下一代通信技术6G的研究与探索已经展开。6G预计将在2030年左右商用,其突破性的传输性能、革命性的网络架构、创新的通信范式,将对音视频…
-
IndexTTS2:用极致表现力颠覆听觉体验
在语音合成技术不断演进的背景下,早期版本的IndexTTS虽然在多场景应用中展现出良好的表现,但在情感表达的细腻度与时长控制的精准性方面仍存在提升空间。为了解决这些问题,并进一步推…
-
ICME 2025 | 火山引擎在国际音频编码能力挑战赛中夺得冠军
音频编码器是多模态大模型的重要组件,优秀的音频编码器在构建多模态系统中至关重要。在此背景下,小米集团、萨里大学与海天瑞声联合主办的 ICME 2025 Audio Encoder …
-
淘宝直播数字人:服务端工程技术
淘宝直播技术团队打造智能数字人的部分实践总结。本文介绍了服务端工程技术,服务端工程是构建稳定、弹性、高并发的后端支撑平台,确保数字人服务高效稳定运行。 01 背景 数字人直播是通过…
-
淘宝直播数字人:音视频&算法工程技术
本文是淘宝直播技术团队打造智能数字人的部分实践总结。 01 文章价值与思路说明 本文给大家带来的价值: 文章分享思路: 带着问题出发: 02 业务背景与价值 数字人直播 商家核心痛…
-
淘宝直播数字人:形象技术
本文将尝试给大家带来数字人形象技术在直播场景使用中遇到的挑战,介绍淘宝直播团队的思考和解法。