技术文章
-
webrtc 回声消除(AEC框架,原理,技术难点以及优化方向)
自 2011 年 WebRTC 开源以来,无论是其技术架构,还是其中丰富的算法模块都是值得我们细细品味,音频方面熟知的 3A 算法(AGC: Automatic gain cont…
-
FFmpeg 框架简读—Bit Stream Filter
在 H.264 中有两种编码的封装格式,一种是 Annex B格式(在ISO-14496-Part 10 的附录B中),一种是 AVCC 格式,也叫 AVC1 格式或 MPEG-4…
-
如何在 web 上构建音频应用程序
主讲人 Hongchan Choi 介绍了在网络上构建音频应用程序的一些想法和考虑,展示一些关于网络媒体制作的一些讨论。 首先抛出一个问题:如果你今天要创建一个网络音频应用程序,你…
-
视频图像处理中的错帧同步是怎么实现的?
1 什么是错帧同步? 一般 Android 系统相机的最高帧率在 30 FPS 左右,当帧率低于 20 FPS 时,用户可以明显感觉到相机画面卡顿和延迟。 我们在做相机预览和视频流…
-
图像处理之三种常见双立方插值算法
图像插值技术概述 图像插值技术在图像几何变换、透视变换等过程中是必不可少的技术环节,可以说像素插值方法最终决定变换之后的图像质量高低。常见的插值方法有 临近点插值 双线性插值 双立…
-
Android 图形系统概述
图形系统是 Android 中非常重要的子系统,与其他子系统相互协作,完成图形界面的渲染和显示。 概述 官方提供了一个图形系统的关键组件协作图,如下所示: 这幅图大致描述了图形数据…
-
ZegoAvatar AI 捏脸技术解析,攻克捏脸技术难点
AI”卷”进实时互动 2021年,元宇宙概念席卷全球,国内各大厂加速赛道布局,通过元宇宙为不同的应用场景的相关内容生态进行赋能。针对“身份”、“沉浸感”、“…
-
ijkplayer框架深入剖析(ijkplayer框架介绍)
随着互联网技术的飞速发展,移动端播放视频的需求如日中天,由此也催生了一批开源/闭源的播放器。 但是无论这个播放器功能是否强大、兼容性是否优秀,它的基本模块通常都是由以下部分组成:事…
-
基于视频理解的智能裁剪和预览
这篇文章主要介绍了 Facebook 基于视频理解,面向用户创建的智能裁剪和智能预览技术。
-
在 Android 上使用 LibVLC 播放视频文件
可以使用LibVLC库嵌入 Android 应用程序上的 VLC 引擎。本教程提供了如何在 Android 应用程序上使用 LibVLC 播放视频文件的示例。 首先,将 LibVL…
-
OpenGL ES 多目标渲染(MRT)
OpenGL ES 多目标渲染 OpenGL ES 多目标渲染(MRT),即多重渲染目标,是 OpenGL ES 3.0 新特性,它允许应用程序一次渲染到多个缓冲区。 利用 MRT…
-
OpenGL ES 帧缓冲区位块传送
前文 OpenGL ES 多目标渲染(MRT)中我们了解了利用 MRT 技术可以一次渲染到多个缓冲区,本文将利用帧缓冲区位块传送实现高性能缓冲区之间的像素拷贝。 OpenGL ES…
-
ROT13 编解码
ROT13是一种替换密码,它将字符串中的每个字母替换为其后的第 13 个字母。ROT13是自己的逆,所以编码和解码使用相同的算法。ROT13 仅转换基本拉丁字母表中的字母,因此数字…
-
使用 PHP 和 Python 进行十六进制编码和解码
十六进制编码用于将二进制数据转换为十六进制表示。它允许获取人类可读格式的二进制数据。十六进制解码是相反的过程。它用于将十六进制字符串转换为二进制数据。 使用 PHP 进行十六进制编…
-
在 Android 中使用 CameraX 显示相机预览
CameraX是一个 Jetpack 支持库,它提供了一个 API 来控制设备的摄像头。这个库允许显示相机预览、捕获图像、执行图像处理。 如果我们想使用 CameraX,我们需要在…
-
Android NDK 开发中快速定位 Crash 问题
在 Android NDK 开发中,排查问题遇到的最熟悉的关键字非 backtrace 莫属,Linux 系统中进程 crash 后通过 backtrace 输出堆栈信息,开发者就…
-
CVPR 2022 | 利用递归 “瞥视” 解码器优化基于Transformer的目标检测算法
本工作由京东探索研究院和悉尼大学联合完成,已经被CVPR 2022 接收,并获得口头报告(oral)展示机会。在本文中,我们提出了一个利用递归“瞥视”解码器的方法来利用兴趣区域信息…
-
直播如何优化弱网观看体验,解决内容分发异常等问题
近年来得益于网络基础设施的进步,实时音视频(Real-Time Communication,以下简称 RTC)和直播(采用 CDN 进行内容分发)在各行业迅速落地,在疫情的催化下更…
-
如何设计音视频服务的高可用架构
前言:ZEGO 即构科技作为一家实时音视频的提供商,系统稳定性直接影响用户的主观体验,如何保障服务高可用且用户体验最优是行业面临的挑战,本文结合实际业务场景进行思考,介绍 ZEGO…
-
WebRTC 教程系列2(WebRTC API功能和特性)
这篇文章主要介绍了 WebRTC 的一些主要 API 和内部自带的建立连接的功能及特性。