技术文章
-
ICASSP 2024|快手获得语音信号质量增强挑战赛和语音音频丢包隐藏挑战赛双料世界冠军
近日,国际声学、语音与信号处理顶会(IEEE International Conference on Acoustics, Speech and Signal Processing…
-
音视频开发者必知的 ISO/IEC/ITU 音视频体系标准
01 常见的国际标准化组织 音视频开发者需要了解ISO/IEC/ITU发布的常见音视频标准,这对他们的编程开发工作至关重要。这些标准包括但不限于:MPEG-1、MPEG-2、MPE…
-
Web 端 1v1 视频聊天示例源码
1v1 视频聊天在泛娱乐场景的应用越来越广泛,为满足广大开发者的试用要求,即构也发布了Web端的 1v1 视频聊天 Demo 源码,命名为Chat1v1。 Chat1v1 是基于 …
-
818台网直播技术解析与优化策略
1. 引言 在万物互联的新时代,数字经济势不可挡,“数字化转型”成为热词,其中直播作为数字化经济发展的重要一环,已然成为当下最热门的互联网场景应用之一,同时也是企业传播信息、展示产…
-
HTTP 流媒体的演变:从渐进下载等到 HLS 和 DASH
2022 年第三季度,通过流媒体直播消费的内容达到了 72 亿小时,这一数据突显了流媒体的巨大受欢迎程度,也强调了 HTTP 流媒体技术在塑造我们的观看体验方面所起的关键作用。 在…
-
Node.js 中的 WebSocket 模块化设计指南
在Web开发的动态环境中,利用实时通信的力量至关重要。WebSocket 已成为一种关键技术,它可以在客户端和服务器之间实现无缝的双向数据流。再加上模块化设计原则,构建稳健、可扩展…
-
WebRTC是什么意思?WebRTC的用例、工作原理及技术优势等
WebRTC是什么意思? WebRTC 是一种 HTML5 规范,可用于在浏览器和设备之间直接添加实时媒体通信。 简单地说: WebRTC 可以让语音和视频通信在网页内运行。 而且…
-
腾讯云音视频的创新技术、多元场景以及出海洞察
编者按:近年来,腾讯云音视频在音视频技术领域不断突破创新,从采集、编码、传输加速、云端媒体处理、分发到解码,不断探索前沿技术,并将其广泛应用于多元化的场景中。与此同时,在海外市场的…
-
OpenCV分享:从新手到专家,计算机视觉工程师的成长指南
(映维网Nweon 2023年12月27日)在上一篇博文中,我们分享了OpenCV对何谓计算机视觉的介绍,包括它的朴素起源,这一迷人技术背后的机制,计算机视觉的任务,以及领先品牌如…
-
如何为 VoIP 软件开发选择正确的技术栈
为 VoIP 软件开发选择正确的技术堆栈对于创建稳健、可扩展和功能丰富的应用程序至关重要。一个全面的技术堆栈可以将流畅的用户体验与滞后的应用程序区分开来,从而使客户感到沮丧。 Vo…
-
低延时视频技术的应用场景和挑战
编者按:无线网络对人们的生活产生了巨大的影响,而5G技术的引入将彻底改变我们与世界互联互通的方式。在5G时代,实现万物互联离不开低延时技术的应用。 LiveVideoStackCo…
-
基于无线技术的VoNR网络感知提升研究
摘要:VoNR是基于IMS网络的5G语音最终解决方案,可充分利用5G大带宽、低时延的特性,给用户带来更佳的通话体验。通过介绍VoNR网络架构,对比VoNR、EPS Fallback…
-
MiroTalk C2C:免费的 WebRTC 实时 Cam-2-Cam 视频通话和屏幕共享平台
开源项目 MiroTalk C2C 简介 免费的 WebRTC 实时 Cam-2-Cam 视频通话和屏幕共享,端到端加密,可通过简单的 iframe 嵌入任何网站。 MiroTal…
-
在欧拉系统上编译安装FFmpeg
FFmpeg支持Linux、macOS、Windows、Android等操作系统,其中Linux系列包括Ubuntu、Debian、Mint、CentOS、RHEL、Fedora等…
-
B站大型开播平台重构
1. 背景 “凡事预则立,不预则废。”——《礼记·中庸》 在文章的开头,我们可以先来了解一下直播业务的大致业务架构。将直播业务简单分为两大类场景”…
-
WebRTC实现音视频通话全流程(提供代码示例)
WebRTC (Web Real-Time Communications) 是一项实时通讯技术,它允许网络应用或者站点,在不借助中间媒介的情况下,建立浏览器之间点对点(Peer-t…
-
在没有自回归模型的情况下实现高效图像压缩 | NeurIPS 2023
本文主要讨论了基于深度学习的图像压缩编码方法(Learned Image Compression, LIC),通过在损失函数中引入相关性损失(correlation loss),强…
-
移动端防截屏录屏技术在百度账户系统实践
在移动端应用的开发过程中,保护用户隐私和应用内敏感信息安全是一个不可忽视的课题。随着诈骗手段的升级,“共享屏幕”被诈骗分子频频使用,因为密码被泄露而导致受害者财物受损的事情层出不穷…
-
网易云商语音算法业务实践
背景介绍 随着 AIGC 和大模型在各个领域逐渐应用,消费者对于个性化、高效、便捷的客户服务和体验需求越来越高。而语音算法作为一种人工智能技术,可以实现语音识别、语音合成、语音情感…
-
音视频学习–运动估计搜索算法五-TZSearch
内容介绍 运动估计(ME)是视频压缩的关键操作。事实上通过消除时间冗余来极大地提高压缩效率,此过程是视频编码器中最关键的部分,本身会消耗超过 50% 的编码复杂度或计算编码时间。为…