技术文章
-
硬件转码器与软件转码器综合指南
转码器的选择是您在成立流媒体公司时需要做出的重大决定。转码器对于视频流和降低成本(编码、CDN、存储)、提高视频质量、提供更少的每像素位数以及使您的内容对最终用户来说看起来很棒! …
-
使用 FFmpeg overlay 滤镜实现画中画效果
在常规的视频图像编辑处理场景中,画中画是必不可少的一个功能,而 FFmpeg 的 overlay 滤镜通过进行参数设置就可以轻松地达到画中画效果,下面就详细讲解…
-
使用 FFmpeg 为视频添加文字并带角度旋转
如何通过Drawtext给视频画上文字,并且能够给文字旋转个角度,比如30度角?本文将重点介绍一下利用FFmpeg如何做到这样的效果,首先看一下效果图: 这样的效果操作原理比较简单…
-
GPUImage是什么?OpenGL GPUImage 源码分析
GPUImage 是 iOS 上一个基于 OpenGL 进行图像处理的开源框架,后来有人借鉴它的想法实现了一个 Android 版本的 GPUImage ,本文也主要对 Andro…
-
音频属性之声道、采样率、采样位数、样本格式、比特率【建议收藏】
不仅限于FFmpeg, 音频采样所得的PCM都含有三个要素:声道(channel)、采样率(sample rate)、样本格式(sample format)。 声道 当人听到声音时…
-
语音识别系列之基于CTC的VAD
语音活动性检测(Voice Activity Dection, VAD)常作为语音识别系统的前端模块过滤非语音段,为后续增强模块提供语音/非语音判据,从而更好的掌握背景噪声特性,进…
-
屏幕内容视频编码的基于哈希的运动估计技术
本文将介绍适用于屏幕内容视频编码的基于哈希的运动估计技术。 屏幕内容用来泛指非相机捕获的视频内容,典型的由计算机生成的文字、图像、动画等。屏幕内容在信号特性上和对人类视觉系统感知上…
-
FFmpeg实现将音频声音变细或变粗
在做录音机磁带倒带或者磁带受潮的时候,音频的声音会变得特别细或者特别粗,主要因素还是播放的时候采样被改变所致,下面来看一下用ffmpeg如何实现对应的效果。 通常单设置采样率时是无…
-
FFmpeg实现用一个音频覆盖另一个音频某个区域
本文重点介绍用FFmpeg实现使用一段音频覆盖另一段音频的某个区域的功能,大概示意图如下: 要实现这样的效果,分析后主要需要以下步骤: 将音频A的30s拆分成三段: 需要播放出来的…
-
OpenGL 之 EGL 使用实践
OpenGL 是跨平台的、专业的图形编程接口,而接口的实现是由厂商来完成的。 而当我们使用这组接口完成绘制之后,要把结果显示在屏幕上,就要用到 EGL 来完成这…
-
Android MediaCodec 硬编码 H264 文件
在 Android 4.1 版本提供了 MediaCodec 接口来访问设备的编解码器,不同于 FFmpeg 的软件编解码,它采用的是硬件编解码能力,因此在速度上会比软解更具有优势…
-
ICIP 2022|基于 Transform Skip 的屏幕内容图像端到端压缩
本文致力于屏幕内容的端到端压缩,提出了一种受 Transform Skip(TS) 启发的屏幕内容图像的端到端压缩方案,目的是提高屏幕内容图像的压缩性能。所提出的模型充分考虑了屏幕…
-
中兴通讯分布式视频云平台方案
作为国内主流传播渠道之一的IPTV/OTT,其安全性一直以来都是业务发展绕不开的要求。近来,中宣部、广电总局、运营商相继提出更高安全要求:中宣部、广电总局要求业务平台具备自动切换能…
-
FFmpeg 的编译问题
关于 FFmpeg 的编译,是个老生常谈的话题了,很多初学者都会卡在怎么编译动态库 so 的问题上,这其实也是 Android 开发转音视频的一大拦路虎,一行 FFmpe…
-
FFmpeg代码结构
以下文章来源于音视频平凡之路 ,作者小安安开火车。 FFmpeg模块分类 打开FFmpeg源码,会发现有一系列libavxxx的模块,这些模块很好地划分了代码的结构和分工。 lib…
-
音视频直播技术现状和未来
音视频直播技术的现状 从直播服务端的角度看,随着时代的发展、技术的进步,单纯的实时互动直播或娱乐直播已经不能满足人们的日常需求了。以在线教育为例,它既要求老师与学生之间可以进行实时…
-
音视频直播的技术路线
音视频直播是众多音视频应用中最亮眼,也是大家最需要的应用。对于不同的行业和领域,在使用音视频直播时,人们往往给直播不同的称谓,比如:在教育领域中使用的直播称为在线教育直播,在远程办…
-
webrtc aec框架和原理(webrtc回声消除算法)
本文章将结合实例全面解析 WebRTC AEC 的基本框架和基本原理,一起探索回声消除的基本原理,技术难点以及优化方向。 回声的形成 WebRTC 架构中上下行音频信号处理流程如图…
-
成果速览 | 高效运动建模的全神经网络视频编码方法
本文是T-CSVT 2022接收论文《DMVC: Decomposed Motion Modeling for Learned Video Compression》的解读。该论文由…
-
使用FFmpeg做音速处理
在做音视频处理技术的过程中,有时候会需要对音频进行速度的调整,比如调快,调慢等,而在FFmpeg中已经有滤镜可以支持这样的调慢、调快的功能,主要是通过atempo滤镜来进行操作,下…