技术文章
-
如何在图像处理中应用深度学习技术
深度学习应用凭借其在识别应用中超高的预测准确率,在图像处理领域获得了极大关注,这势必将提升现有图像处理系统的性能并开创新的应用领域。 工业应用中FPGA 上的神经元网络(CNN) …
-
图像处理的分类、一般流程与算法
常用的图像处理算法:数字图像处理基础、遥感数字图像处理、机器视觉、计算机视觉 图像处理程序:C++ OpenCV、Matlab与图像处理 数字图像处理-概述 其实,造成“不可能图形…
-
详解YUV 图像的基本处理
YUV 图 1. YUV 的由来 YUV 是一种色彩编码模型,也叫做 YCbCr,其中 “Y” 表示明亮度(Luminance),“U” 和 “V” 分别表示色度(Chromina…
-
2022年视频编解码器的现状
2022年视频编解码器的现状 ,作者Jan Ozer介绍与 H.264、VP9、HEVC、AV1、VVC、低复杂度增强型视频编码(LCEVC)和基本视频编码(EVC)有关的最重要的公告。
-
利用 OpenGL ES 给视频播放器做个字符画滤镜
不少朋友问,OpenGL ES 入门后怎么学习写一些滤镜 ?怎么学习 shader ? 最近请教了一些大佬,他们一致认为正确的做法就是“去模仿”。先去模仿别人的滤镜怎么实现的,比如…
-
AliIAC 智能音频编解码器:在有限带宽条件下带来更高质量的音频通话体验
随着信息技术的发展,人们对实时通信的需求不断增加,并逐渐成为工作生活中不可或缺的一部分。每年海量的音视频通话分钟数对互联网基础设施提出了巨大的挑战。尽管目前全球的互联网用户绝大多数…
-
WebRTC 架构格局正在发生变化
现在有一种新型的 WebRTC 应用程序架构正在发展,称为 WebRTC Unbundling,尽管它可能不适用于所有应用程序场景,但至少在开发新的实时视频开发项目时应该考虑一下它。在过去,三种不同类型的 WebRTC 应用架构即符合标准的 WebRTC、开源媒体服务器和称为 CPaaS 的商业媒体服务器是基于 WebRTC 开发的选项,这三个仍然是有效的架构选择,WebRTC Unbundling 只是第四个选择,可以认为它是符合标准的 WebRTC选项的另一种形式。
-
Android OpenGL ES 实现相机预览
OpenGL ES 相机预览 OpenGL ES 相机预览 相机开发是 OpenGL ES 开发的重要应用,利用 OpenGL 可以很方便地实现相机美颜、滤镜、塑型以及一些动态特效…
-
DPKI的崛起之路——分布式数字身份(DID)
一、引言 互联网的出现和普及使得传统身份有了另一种表现形式,即数字身份,除自然人以外,机构组织、智能设备、虚拟网络都可以作为实体并拥有数字身份,这些实体作为数字化社会的重要组成部分…
-
面向极低码率的概念压缩
本文分享了来自北京大学马思伟教授课题组的工作《Conceptual Compression via Deep Structure and Texture Synthesis》。该论…
-
VR 直播系统,游戏VR直播的注意事项
本文是来自Evolution的技术人员Behnam Kakavand在Demuxed 2021上的演讲。该公司是一个线上游戏公司,旗下的游戏主要是各类线上DC游戏。这类强交互性的桌…
-
使用 CNN 和 TensorFlow 2 对 CIFAR-10 图像进行分类
CIFAR-10是一个由 60000 张彩色图像组成的数据集。数据集分为 50000 张训练图像和 10000 张测试图像。每张图片大小为 32×32,与来自 10 个类…
-
阿里视频云互动虚拟技术,随时随地打造虚拟沉浸直播间
2022是“体育超级大年”,冬奥会、亚运会、大运会、世界杯等各类大型体育赛事贯穿全年。由于受到疫情管控和物理空间的限制,赛事直播至关重要,观众体验需求也在不断升级。 于此,企业对直…
-
webrtc技术详解(webrtc技术架构)
开放互联网和现代计算机的形成例证了科技开放驱动创新成长的能力。HTTP 协议大概是有史以来最伟大的发明之一,计算机可以通过 HTTP 协议从服务器请求和接收数据。 不幸的是,这些创…
-
Web3概念的演进 ——Web3简析系列(4)
当前关于Web3.0,有两个截然不同的概念。一个主要在学术界,一个主要产业界和投资界。
-
Base64URL 编码和解码
Base64URL是一种类似于Base64的编解码方案。Base64 使用一些字符对不能直接在 URL 中使用的数据进行编码。+,/和字符=在 URL 中具有特殊含义,可能会导致错…
-
去中心化Web,Web3流派二 ——Web3简析系列(3)
一、传统Web存在的问题 Web2.0催生了一大批的互联网企业。然而,在Web2.0下,由于平台属于企业,用户的信息、用户的数据都存放在平台上。这种中心化的模式,带来诸多问题,如:…
-
TikTok背后的人工智能如何运作
TikTok 是一款视频分享应用,可让用户创建和分享短视频。它以“只为你”的个性化推荐给用户留下深刻印象。它非常容易上瘾,在 Z 世代中很受欢迎,它的背后是人工智能技术。 Tik…
-
webrtc 回声消除(AEC框架,原理,技术难点以及优化方向)
自 2011 年 WebRTC 开源以来,无论是其技术架构,还是其中丰富的算法模块都是值得我们细细品味,音频方面熟知的 3A 算法(AGC: Automatic gain cont…
-
FFmpeg 框架简读—Bit Stream Filter
在 H.264 中有两种编码的封装格式,一种是 Annex B格式(在ISO-14496-Part 10 的附录B中),一种是 AVCC 格式,也叫 AVC1 格式或 MPEG-4…