技术文章
-
语音质量测试新手入门指南
我们都经历过与企业的交互式语音应答(IVR)系统交互的情况,由于语音质量差,几乎无法完成自动任务或在需要时获得 “自助”。听着断断续续的提示音,听着线路上的…
-
SDL播放音频PCM
SDL 是一个很好用跨平台多媒体开发库,可以方便的使用 SDL 来学习音视频,本文将介绍如何使用 SDL 播放 PCM 数据,主要内容如下: SDL介绍 SDL(Simple Di…
-
音视频问题汇总–非零frame_num值导致的一个绿屏问题
背景介绍本周收到这样一个反馈的问题:我们的测试小姐姐通过自研RTSP客户端拉流过程时发现了一个较为困扰的问题。她注意到,在操作一款特定型号的IPC设备时,每次拉流都会出现首帧绿屏的…
-
一文讲透基于感知超分模型的实时视频抗弱网技术
在当今数字化快速发展的时代,实时视频通信已成为我们日常生活和工作中不可或缺的一部分。无论是远程教育、在线会议、社交娱乐还是远程医疗等领域,实时视频通信都发挥着关键的作用。 弱网环境…
-
WebRTC 监控的 6 个技巧
WebRTC 用户都知道,会议可能会中断。连接问题和媒体质量问题相当常见。如果 WebRTC 服务部署得当,那么 90% 或更多的问题都是由于用户方面的问题造成的–无论…
-
如何利用实时互动性提升视频流媒体
您是否想过,是什么让视频流媒体行业如此颠覆传统的直播视频内容? 很难说清其背后的原因。您可以讨论多种设备上的视频内容的多样性。或者是智能算法带来的个性化观看体验。当然,作为传统直播…
-
Stable Video Diffusion: 将潜在视频扩散模型扩展到大型数据集
本文主要讨论了在生成视频模型中数据选择的重要性以及数据筛选对模型性能的影响。文章指出,虽然在视频建模方面的研究主要集中在空间和时间层的排列上,但对于数据选择的影响却鲜有研究,文章通…
-
利用语音技术生成的三维人类运动
随着科技的不断发展,AI语音驱动的虚拟形象越来越受到关注,用户通过输入文本或语音,以一定规则或深度学习算法,完成口型和面部表情的精准驱动,以快速构建丰富的虚拟形象智能驱动应用,此项…
-
B站边缘网络四层负载均衡器的探索与应用
01 背景介绍 B站的 CDN 下行边缘节点过去是非集群化架构。这种架构下有几个弊端: 针对以上问题,我们调研了常见的四层负载均衡器, 传统的 SLB,LVS,DPVS 这类四层负…
-
Socket.IO 的架构模式和注意事项
本文深入探讨了 Socket.IO 的几种不同架构模式以及每种模式的注意事项。 Socket.IO 架构设计模式 软件开发人员在构建实时移动和网络应用程序时,通常会选择开源 Soc…
-
流媒体视频的最佳音频比特率是多少?
音频流媒体的世界在不断发展,越来越多的人开始享受数字音频内容。随着市场的扩大,许多人从传统媒体转向音频和视频流媒体。然而,提供高质量的音频内容可能是一项具有挑战性的任务。 影响流媒…
-
什么是SRTP(安全实时传输协议)?SRTP在实时通信中的作用
实时媒体流正变得越来越流行。因此,保护敏感的语音和视频通话安全,防止黑客攻击至关重要。安全实时传输协议(SRTP)为实时传输协议(RTP)增加了加密、验证和重放保护功能。这样就能在…
-
之家消息推送平台的演进(一)——概况与现状
1. 引言 当今时代,移动应用程序(APP)已经成为人们日常生活的重要组成部分,无论是社交媒体、电子商务、新闻资讯、娱乐还是其他方方面面,APP都为用户提供了各种各样的便…
-
粗略解读FFmpeg cmd多线程重构
1、为什么还要聊多线程? 早期网络编程很多是基于多进程或多线程的,后来event loop方式普及了,再后来协程更受推崇。多线程编程仿佛是个老旧过时的技术,一点都不酷。 但是,单纯…
-
浅谈WebSocket协议在Web领域的应用
Labs 导读:WebSocket是一种双向通信协议,主要应用在Web浏览器,解决服务器端主动向浏览器推送消息的问题。WebSocket常见的应用场景有页游、视频网站、在线文档、股…
-
使用 WebSockets 和 Redis 在 Node.js 分布式架构中进行实时消息传递
在管理许多有状态连接时,使用分布式系统会带来新的复杂性,就像在 Web 应用程序中实现实时消息传递功能时所必须的那样。本文旨在提供一个简洁的示例,说明如何使用 WebSockets…
-
Dragonfly:以更高的感知质量实现连续 360° 视频播放 | SIGCOMM 2023
在流式传输 360° 视频时,通过将视频在空间上分割为 tile 并仅传输用户的视口,可以减少 5 倍带宽。但正确预测用户的视口非常困难,这就导致由于错误预测用户视口以及网络带宽下…
-
DDoS:VoIP 攻击者的主要阵地
随着黑客将目标对准越来越多缺乏全面安全措施的组织,网络攻击不断成为头条新闻。VoIP(IP 语音)通信尤其容易受到系统入侵,因为它负责将数据和语音流量汇聚到一个共同的 IP 网络上…
-
数据赋能音视频业务降本增效—— 基于最佳实践的顾问式服务
编者按:随着全行业视频化的趋势,对视频云的需求已从最初的功能完善、弹性可扩展,演进到提升业务体验、支撑业务增长和优化业务成本。LiveVideoStackCon2023深圳站邀请到…
-
IM专题:服务化架构IM系统(1)—架构解读
前面,我们分析了单体架构 IM 系统(IM专题:单体架构IM系统(1)),在日活量低(DAU < 2000)、开发人员少(1位前端+1位后端+1位架构师)、开发周期短(两周时…