技术文章
-
FFmpeg音频视频转换
FFmpeg是一个开源的跨平台音视频处理工具和多媒体框架。它可以用于处理音频、视频、字幕等多媒体数据,支持多种音视频格式的转码、编辑、解码、编码和流媒体传输等操作。 应用场景: F…
-
Meta 在 RTC 领域取得的进展 | RTC of scale 2023
背景 非常激动能在此介绍 meta 在 RTC 领域取得的进展。在过去的一年刚刚经历了疫情,那时候没有人知道 RTC 在后疫情时代将会如何发展。而现在,我们有了一年的后疫情时期的数…
-
MediaUni——面向未来的流媒体传输网络设计与实践
“立足当下,着眼未来”,任何一位从业者都应该谨遵这样的格言。阿里云通过总结这么多年的流媒体传输服务,分析痛点、提出措施、改进技术、认真思考,带来了MediaUni这样一个面向未来的…
-
使用OpenCV进行目标提取详细教程(附python代码演练)
今天的文章将讨论并指导你识别图像中的对象,使用 OpenCV 对这些对象进行遮罩处理。让我们开始吧! HSV 色标 请花一点时间观察下面的图片。每个图块似乎是不同的颜色,对吧?但是…
-
EdgeGPT: GPT-4邂逅边缘计算与6G
本文将基于我们组最近的工作《Large language models empowered autonomous edge AI for connected intelligenc…
-
音频编解码学习:MDCT变换的原理和实现方法
在音频编解码中,MDCT变换是一个非常重要的基础概念,它在MP3和OGG介绍中都有涉及到。MDCT变换是一种数学变换,它将时域信号转换为频域信号,这对于音频编解码来说非常关键。很多…
-
Apple Vision Pro如何做到“声”临其境?
2023年6月6日的WWDC23大会,苹果官方推出了多年筹划的MR产品:Apple Vision Pro,并将于2024上半年在美国上市,随后扩展到更多市场。首先介绍三个类似但截然…
-
如何使用 Socket.io 构建实时 Web 应用程序
Socket.io 是一个 JavaScript 库,允许 Web 客户端和服务器之间进行实时双向通信。它是创建聊天应用程序、协作白板、多人游戏等实时 Web 应用程序的热门选择。…
-
解决影响 WebRTC 应用视频质量的问题
如何在 WebRTC 应用程序中获得更好的视频质量?这个问题很常见,也很容易理解: 如果我们能在 YouTube 视频中获得 2K、4K 或更高的质量,为什么不能在 WebRTC …
-
基于自回归与分层先验的深度学习图像压缩模型
本文提出了一种结合自回归、层次化以及组合先验的方案,并权衡他们的成本与效益。众所周知,自回归模型会带来显著的计算代价,但我们发现在压缩性能方面,自回归和分层先验是互补的,而且共同利…
-
HDR and VVC: 从梦想到主流
本文演讲者帕特·格里菲斯是杜比公司技术副总裁,也是美国电影和电视工程师协会的主席,这是一个为好莱坞内容创造许多标准的团体,也创造了许多今天将在HDR谈论的标准。今天演讲将谈谈历史上…
-
Shader 编程:只用一个函数就能生成三角形、矩形等所有的正多边形
绘制多边形的思路跟画圆的思路一样,圆形可以看做一个有正无穷边的多边形。有了这个思路你就可以明白,我们需要为每条边划分对应的弧度,弧度相同它就是正多边形。 直接上代码: 代码里比较关…
-
浅谈网络传输中的错误恢复机制
丢包作为网络传输中一个常见的问题,一直被各个传输控制协议拿出来讨论。错误恢复机制的性能也被认为是传输控制协议性能的重要组成部分,接下来我们简单的介绍下常见的错误恢复机制,并进行对比…
-
为初学者揭秘 WebRTC 视频通话应用程序
你是一名开发人员(前端/后端/全栈),对使用 WebRTC 开发应用程序感到好奇吗?在过去的几天甚至几个月里,你是否在互联网上搜索学习基础知识并构建一个基本的 WebRTC 视频通…
-
从 VoIP 和 SIP 到 WebRTC
在本文中,我们将介绍在 WebRTC 客户端和传统 SIP 客户端之间进行 WebRTC 呼叫的解决方案。 SIP 简介 SIP(会话初始协议)是一种信令协议,用于在特定网络上的两…
-
VVC视频播放现状
本文分享者 Jan Ozer 在演讲中从三个不同的目标平台——电脑端、移动设备端以及起居室中的电视端讲述了VVC视频播放的现状。 来源:Streaming Media East 2…
-
Shader 实现彩虹旋涡的4个示例代码
本文分享绘制彩虹漩涡的4个示例代码。 示例代码一 先绘制一个螺旋状的图形 代码效果: 中心点大体在(0.5,0.75)的位置上 示例代码二 代码效果 加入color += sin(…
-
CVPR2023|Micron-BERT: 基于BERT的人脸微表情识别
导读 微表情识别是情感计算中最具挑战性的课题之一。它的目的是识别人类难以在短时间内(0.25到0.5秒)感知到的微小面部运动。然而,针对视觉问题,现有方法中的标准 BERT 只能从…
-
WebSub 是什么?(WebSub入门系列一)
WebSub是一种能够实时通知内容更新的协议。它基于发布者/订阅者模式,即发布者发布内容更新,订阅者接收这些更新。WebSub 允许以分散和可扩展的方式进行通信。 在 WebSub…
-
WebRTC Leak IP原理详解
WebRTC(网页即时通信,Web Real-Time Communication)是一种开放标准和技术集合,用于在Web浏览器之间实现实时通信和音视频通信而无需添加额外的浏览器拓…