技术文章
-
HLS 播放列表中的 EXT-X-KEY 是什么?
在HLS 播放列表文件中,EXT-X-KEY标签指定用于解密媒体片段的方法。它告诉视频播放器如何检索必要的解密密钥来解锁加密的媒体片段并播放它们。 请注意,如果 HLS 媒体播放列…
-
车联网消息通信的关键变革:一文了解 QUIC 协议
什么是 QUIC 协议 QUIC(Quick UDP Internet Connections)是由谷歌公司开发的一种基于用户数据报协议(UDP)的传输层协议,旨在提高网络连接的速…
-
OpenGL Shader 颜色混合模式(Blend Mode)
在之前的文章中提及了 Shader 中的颜色计算,介绍了一些基本的颜色混合计算,然而在实际的 Shader 滤镜中,简单到加减乘除并不能很好地还原出我们想要的效果,mix()也只是…
-
uniapp如何设置视频分辨率、帧率、码率等配置(uniapp音视频开发系列4)
本文分享即构 Uniapp 实时音视频 SDK 视频配置功能。 功能简介 在视频通话或直播时,开发者可以根据需要指定推流和拉流视频相关配置,如视频采集分辨率、视频编码输出分辨率、视…
-
5G网络能力开放安全架构和流程研究
5G网络能力开放的业务需求随着5G网络的规模商用正不断涌现,对网络能力开放的安全保障也逐渐成为运营商重点关注的问题,基于此,对5G网络能力开放的安全架构和流程进行了研究。首先,介绍…
-
WebRTC 之 FEC、RED、PLC、RTX和其他缩写所起的作用
WebRTC media resilience 如何工作?什么是FEC、RED、PLC、RTX,以及为什么需要它们来提高实时通信的媒体质量。 网络本质上是挑剔的,媒体编解码器更是如…
-
连续可变码率的非对称增益深度图像压缩 | CVPR 2021
本文提出了一个连续码率可调的深度学习图像编码框架,即非对称增益变分自动编码器(AG-VAE)。AG-VAE利用一对增益单元在一个单一的模型中实现离散可变码率,其额外的运算量可以忽略…
-
使用 OpenCV 的 SIFT 图像特征提取和匹配
图像特征提取和匹配是计算机视觉和图像处理中的重要任务。它们在图像识别、目标检测和图像拼接等各种应用中发挥着至关重要的作用。 一种流行的特征提取算法是尺度不变特征变换 (SIFT),…
-
FreestyleNet:自由式布局到图像生成 | CVPR 2023
本工作是由上海交通大学宋利教授带领的Medialab实验室与新加坡管理大学、南安普顿大学合作产出,并被CVPR 2023录用。本文提出了一个基于diffusion model的框架…
-
开源 SIP 服务器 kamailio 核心配置文件cfg
Kamailio的配置文件是一个文本文件,通常命名为”kamailio.cfg”。它包含了Kamailio的配置信息和路由规则,用于控制Kamailio的呼…
-
苹果 AirTag 新专利曝光:可搭配 HMD 实现全身运动追踪
苹果于 2021 年 4 月首次推出“AirTags”。在近日苹果新曝光的专利中,其正在开发一种新型的 AirTag,苹果简单地将其描述为“可穿戴标签”,它可以与&nbs…
-
WebRTC RTP H.264 封包与解包
再谈RTP 协议 我们首先了解一下 RTP H.264 相关的 RFC,下面的内容是对两篇 RFC 的总结:RTP: A Transport Protocol for Real-T…
-
WebRTC 音频设备模块 ADM
我真正接触 WebRTC 的 ADM 是在做 iOS 混音的时候,iOS 的音频采集、播放之前没有做过,所以想着从 WebRTC 的音频采集播放代码里借鉴一下 AudioUnit …
-
在线 KTV 实时打分功能,音高线提取精确率高达 99%
当我们对音乐的体验不再止步于单纯的演唱与倾听,对音乐演唱及互动反馈有了更多的需求时, KTV 打分功能便应运而生。 传统的线下 KTV,通常会用在 KTV 打分系统中预先存储好每首…
-
MetaAI发布语音识别错误率是OpenAI的Whisper模型的一半且支持1107种语言的语音模型:MMS
今天,Meta的首席AI科学家Yann LeCun在推特上宣布了MetaAI的最新研究成果:MMS,一个支持1107种语言的自动语音识别模型和语音合成模型,该模型自动语音识别的单词…
-
人脑启示录:AGI能力演进与未来发展趋势
2023年4月28日,中共中央政治局会议提出,要重视通用人工智能发展,营造创新生态,重视防范风险。通用人工智能(AGI)终极目标是到达人类的智能水平,具备理解、学习、推理和创新的能…
-
嵌入式音视频开发面试过程遇到的问题!
今天继续给大家分享音视频面试过程会被常问到的一些问题! 面试的具体题目 1、说一下播放器的设计过程 这里的话主要分以下几步完成: 开启一个线程进行解封装操作 , 这包括:读取音频、…
-
实时互动下视频 QoE 端到端轻量化网络建模
在实时视频互动中,影响观众对视频体验的有较多且复杂的因素,包括:画质、流畅度以及与其耦合的观看设备等。传统客观算法会利用网络传输或编解码参数拟合接收端人的感知体验,或者使用图像质量…
-
uniapp音视频通话SDK接入指南(uniapp音视频开发系列2)
本文分享即构uniapp音视频SDK接入指南。即构 uni-app SDK 是一个基于 ZegoExpressEngine 原生 Android 及 iOS SDK 的 uni-a…
-
探索标清流媒体直播: 标清流媒体的优点和缺点
SD Live Streaming代表标清直播,既有优点也有缺点。从积极的方面来看,标清流媒体与各种设备兼容,可以为广大观众所用。它需要更少的带宽,导致更快的加载时间和更少的缓冲。…