技术文章
-
从文本到意义:自然语言处理算法的工作原理
自然语言处理 (NLP) 是一个结合计算机科学和语言学以帮助机器理解人类语言的研究领域。NLP 已成为现代技术不可或缺的一部分,为从聊天机器人到语音助手的一切提供动力。但是 NLP…
-
Meta 专利探索在AR/VR环境中的视频通话体验
视频会议已经成为人们联系的一个重要方式。然而,当前的视频通话属于2D表示,所以能够实现进一步临场感的AR/VR成为了行业关注的一个方向。 在名为“Parallel video ca…
-
AIGC技术将掀起算力需求革命,PPIO王闻宇深度剖析对边缘计算的影响
编者按:TGO的《大咖面对面》直播栏目已经播出第四期。今天,我们邀请了两位TGO会员来共同探讨「边缘计算的未来、应用落地与新格局」。TGO致力于让拥有共同话题、背景和认知的人聚集在…
-
IFRNet:用于高效帧插值的中间特征细化网络
目前流行的视频帧插值算法,从连续的输入产生中间帧,通常依赖于复杂的模型结构,具有沉重的参数或大的延迟,阻碍了它们的实时应用。作者设计了一个高效的基于编码器-解码器的网络,称为 IF…
-
FFmpeg 中的音视频编码格式
为什么要进行视频编码,直接进行存储、播放、传输不是可以省去编码、解码的时间吗?下面我们通过数据来分析一下: 例子:一张大小为1080*720 的图像,帧率25FPS,一个像素用12…
-
画质增强中的超分辨率
什么是超分辨率? “分辨率”是一个泛指图像清晰程度或者图像输出设备解析能力的词,其实就是我们经常说的那个空间分辨率。(凡是能度量的量都存在分辨率,比如时间、空间、光谱、辐射量等等,…
-
ICLR 2023 | TranSpeech:高质量非自回归语音到语音翻译
语音到语音翻译(S2ST)对于打破语言壁垒与沟通障碍非常有益。传统的 S2ST 系统通常由语音识别(ASR),机器翻译(MT)和语音合成(TTS)三部分组成。与这些级联系统相比,直…
-
WebRTC SDP 简介
一. What is SDP, SDP 是什么 SDP 的全称 是Sessioin Description Protocol。为会话通知、会话邀请和其它形式的多媒体会话初始化等目的…
-
Vulkan 内存管理
一、简介 内存管理对开发者来说永远是一个沉重的话题。 现有的高级语言都在通过各种努力,试图让开发者摆脱内存管理的复杂工作,专注于业务逻辑的开发。这样的做法对开发者是友好的,较低的语…
-
分享四个屏幕共享API,实现Web屏幕共享
屏幕共享已成为许多 Web 应用程序的重要组成部分,因为它可以实现远程协作和支持。虽然大多数开发者都熟悉用于屏幕共享的标准 WebRTC API,但还有其他不太为人所知的 API,…
-
IM专题:分层架构IM系统(14)—群消息逻辑实现
前面我们分析了 “点对点消息” 的实现逻辑(IM专题:分层架构IM系统(12)—消息收发逻辑实现),今天分析 IM 群消息逻辑。 在之前的文章分析过,“私信消息”(即点对点消息)属…
-
视觉检测中如何提高图片处理速度与质量?
机器视觉系统大体分为图像采集和图像处理两个部分。 图像采集是工业相机与PC端通过图像采集卡相互链接,图像采集卡接收工业相机的模拟信号或数字信号,并将信号处理转换为适用于PC端的信息…
-
FFmpeg 入门学习 07–创建音视频解码管理类
使用 FFmpeg 进行音视频解码,其实是一套标准操作,按照固定的流程进行实现即可。使用 FFmpeg 进行音视频解码的基本流程、及用到的关键 API 接口和 结构体,如下图所示:…
-
FFmpeg 入门学习 06–音视频解码基本流程
如上图所示,在之前文章中介绍了视频播放的基本原理、并且已经实现了解封装的功能。解封装得到的 AVPacket 数据是压缩过的编码数据,需要进一步解码后才可以进行播放。 使用 FFm…
-
FFmpeg 入门学习 05–给解封装线程增加休眠唤醒机制
为使解码过程不会受到解封装过程进展的影响,解封装和解码一般并行操作,两者之间通过缓存数据进行交互。如上图所示: 解封装线程和解码线程可以套用生产者和消费者模式来实现线程间的通信。为…
-
基于隐式表征的光场图像压缩
随着多媒体技术的发展,沉浸式与高自由度逐渐成为多媒体领域重要的发展方向。光场作为众多新媒体形式之一,能够同时捕获空间中光线强度和角度信息,相比于传统媒体具有更丰富的信息和更高的自由…
-
FFmpeg 入门学习 04–生产者消费者模式
为使解码过程不会受到解封装过程进展的影响,解封装和解码一般并行操作,两者之间通过缓存数据进行交互。 背景 生产者消费者模式 如下图所示:生产者在缓冲区未满时不断添加数据,并唤醒消费…
-
超声波传感器带给无人机更经济的定位解决方案
在3D空间中确定确切位置(如机器人或无人机)是一件很难做到的事情。标准的GPS精度非常低,这就是为什么你的导航系统有时会认为你正在附近的道路上行驶,而不是实际行驶的道路。 GPS-…
-
FFmpeg 入门学习 03–缓存队列的实现
在之前的文章中实现了打开视频文件并进行解封装的功能,解封装之后即可进行解码操作。为使解码过程不会受到解封装过程进展的影响,解封装和解码一般并行操作,两者之间通过缓存数据进行交互。 …
-
FFmpeg 入门学习 02–音视频解封装功能实现
在上一篇文章中介绍了视频播放的基本原理。本文继续使用 FFmpeg 来实现其中音视频解封装功能。 封装格式 封装格式(也叫容器)就是将已经编码压缩好的视频流、音频流及字幕按照一定的…