技术文章

实时音视频

Android App音视频开发学习路线(android音视频开发方向)

本文分享 Android 新手上手 App 音视频开发的学习路线应该是什么样的；同时介绍下 Android 项目中音视频实际开发会遇到的一些事情以及解决方案，我们今天只谈思路涉及具…

RTC观主
2023年4月12日
技术文章

HEVC 中的 IDR 与 CRA 帧的区别及用例

IDR（Instantaneous Decoder Refresh）和 CRA（Clean Random Access）帧是视频编码中的 IRAP（Random Access Pi…

编解码
2023年4月12日
技术文章

窄带高清画质增强之生成式细节修复

阿里云窄带高清本质上是一种转码质量优化技术，是一套以“人眼主观感受最优”为基准的视频编码技术。研究的是在带宽受限的情况下，如何追求最佳的视觉感受，即人眼感受的主观质量最优。视频画…

大厂Animal
2023年4月12日
WebRTC

WebRTC Android 视频硬编码实现分析

前面我们分析了 WebRTC 的相机采集和预览，接下来的环节就是编码和传输了。本篇关注编码相关的内容，同样也是聚焦于三个问题：数据怎么送进编码器？怎么从编码器取数据？如何做流…

webrtc学习和实践
2023年4月12日
实时音视频

AI 教你从前端转型音视频开发高手

前面我们介绍过几篇关于音视频开发的文章，这里不得不提下 ffmpeg。最直观的案例：转码对指定高分辨率的进行低分辨率的转码：对应的命令： *、”-i a.mp4…

RTC观主
2023年4月12日
实时音视频

腾讯云快直播低延时播放质量的优化实践

直播已经潜移默化成为许多人日常生活密不可分的一部分。无论是紧张刺激的比赛直播，还是垂涎欲滴的美食直播，亦或者自卖自夸的购物直播，大家都不希望在观看时出现长时间的加载和卡顿，对一些需…

大厂Animal
2023年4月12日
技术文章

基于深度学习的交通噪声评估与控制方法

随着城市不断发展，交通噪声日益得到人们的关注，若长时间暴露在交通噪声之中，对人的身心健康会产生一定的负面影响，如听力障碍、情绪烦躁、心脏病等。目前控制并减少交通噪声是交通噪声管理研…

假装是大佬
2023年4月12日
技术文章

新媒体可视化互动视频制作系统在新闻报道中的应用

随着媒体融合的快速发展，新闻报道形式不再局限于传统的图文和视频，而是呈现多元化的媒体形态，新闻传播的互动性逐渐增强，观众需要更加沉浸式和交互式的观看体验。互动视频是一种全新的…

视频技术
2023年4月11日
技术文章

视频技术新纪元-面向机器编解码标准

后疫情时代，随着技术的不断发展，机器已经转化为人们生活中的第三只“眼”，如工业质检，无人驾驶，智慧城市等应用愈加依赖与视频信息分析与理解，而使得视频能够更利于机器分析的同时能够进一…

视频技术
2023年4月11日
技术文章

元宇宙开放标准（MSF）简介

元宇宙是一个虚拟空间，它结合了网络的连接性和空间计算的沉浸性，汇集了多种颠覆性技术，元宇宙标准论坛是标准组织和更广泛的行业之间的合作场所，以促进开放和包容的元宇宙的互操作性标准的发…

元二
2023年4月11日
技术文章

NED：自然视频中保持语音的人脸表情语义控制 | CVPR 2022

这篇文章提出了一种用于在自然视频中对人物的情绪状态进行真实感操纵的深度学习方法。该方法基于输入场景中人物的 3D 人脸参数表示，从头部姿态和面部表情中解耦了人脸身份，然后使用一个新…

图像处理
2023年4月11日
技术文章

宽高比和 16:9 宽高比：视频技术中宽高比的综合指南

在视频世界中，“宽高比”在视觉内容的呈现和质量方面起着重要作用。宽高比是指图像或视频的宽度和高度之间的比例关系。你的视频的宽高比会影响它在不同设备屏幕上的显示方式，从而影响观众体…

视频技术
2023年4月11日
技术文章

边缘计算，光的形式

“嘿，Siri，今天天气怎么样？” 设想这样一个场景，当你早上起床，向你的智能手机发起这样一个语音指令，从用户命令到结果可能有大约0.2秒的延迟——看似一个非常小的数字，但实际上，…

RTE基础设施
2023年4月11日
技术文章

音视频编解码–PNG格式代码走读

PNG格式是一种流行的图像文件格式，编解码是音视频编解码中的重要一环。在本文中，我们引用了FFMPEG 5.0中的代码，深入探讨了PNG编解码的实现。在具体的代码实现中，涉及到了…

编解码
2023年4月11日
技术文章

2023 年 MQTT 协议的 7 个技术趋势｜描绘物联网的未来

MQTT 是物联网消息传输标准协议，其采用极其轻量级的发布订阅消息模型，以可扩展、可靠且高效的方式连接物联网设备。自 1999 年 IBM 发布 MQTT 以来已经过去了二十多年…

RTE基础设施
2023年4月11日
即时通讯

IM专题：分层架构IM系统（16）—多媒体逻辑实现

现在 IM 系统已经不仅限于文本消息的通讯了，多媒体数据占据越来越多的比重，比如：文件传输、语音通话、视频通话等。在前面的文章（IM专题：IM需求分析模型）中我们分析过，“多媒体…

IM开发老王
2023年4月10日
实时音视频

音视频开发进阶课程｜第七讲下：分辨率与帧率之“一定频率”

在视频系列的上一篇推文中，我们简单总结了色彩、像素、图像和视频等基础概念之间的关系。并且主要关注了两个组合：像素和图像，图像和视频之间的构成逻辑。我们先来简单回顾一下：从像素到图…

ZEGO即构科技
2023年4月10日
WebRTC

WebRTC MediaDevices API 获取媒体设备的访问权限(webrtc入门二)

本文将介绍 MediaDevices API，如何获取用户的媒体设备（摄像头和麦克风）以及如何获取特定的视频分辨率等。这部分是上一篇文章《使用 JavaScript 和 Node…

webrtc学习和实践
2023年4月10日
技术文章

Gartner视角下，边缘云是新兴技术的影响雷达

最近，我们在谈视频化狂飙、谈AIGC颠覆、谈算力动能不足，很少谈及边缘。但“边缘”恰恰与这一切相关，且越发密不可分，它是未来技术发展的极大影响因子。 “到2025年，超过70%的组…

大厂Animal
2023年4月10日
实时音视频

FFmpeg 入门学习 09–音视频解码公共接口实现

使用 FFmpeg 进行音视频解码，其实是一套标准操作，按照固定的流程进行实现即可。使用 FFmpeg 进行音视频解码的基本流程、及用到的关键 API 接口和结构体，如下图所示：…

FFmpeg笔记
2023年4月10日