技术文章
-
非约束环境下的轻量级实时多人三维动作捕捉
研究意义 基于多视角的多人三维姿态估计技术可以实现非接触式的多人三维动作捕捉,因而在影视动画、游戏、虚实互动和体育运动分析等领域存在广泛应用。基于该技术,我们可以通过若干个标定好的…
-
Transformer神经网络架构详解
Transformer是一种新型的深度前馈人工神经网络架构。在本文中,通过底层数学、python代码实现和不同层的可视化来解释了Transformer架构。
-
FFmpeg 解封装解码流程
先简单的了解一下FFmpeg 使用过程中需要用到的FFmpeg库、播放与解码流程、函数和相关的结构体。 FFmpeg 库简介 库 介绍 avcodec 音视频编解码核心库 avfo…
-
WHIP 和 WHEP 协议简介【WebRTC基础知识】
本文简单介绍了 WHIP 和 WHEP 协议的定义,作用和产生背景。方便大家了解 WebRTC 行业发展,以及处理 WebRTC 在发布者、媒体服务器和播放器之间关系。
-
如何在 Chrome、Firefox、Safari 和 Opera 中禁用 WebRTC
在本文中,我们将向您展示如何在最流行的操作系统的各种浏览器中禁用 WebRTC。 WebRTC 是什么以及它是如何工作的 WebRTC 表示 Web 实时通信。该协议是一种开放标准…
-
初探XR虚拟制作技术及其在电视制播中的应用
摘要:本文从LED显示屏、摄像机跟踪系统、图形渲染引擎三方面阐述了XR虚拟制作的技术基础,并结合XR虚拟演播室业务实践,探讨了XR虚拟演播室实现技术、基本流程和方案选型。 作者:广…
-
2023年总台竖屏春晚技术创新应用及实践
摘要:2023年总台竖屏春晚在腾讯视频号、央视频、央视新闻等播出端圆满呈现,本次竖屏春晚在采集端、制作端、传输端、呈现端实现端到端高清HDR 50P+双耳渲染菁彩声效果。本文介绍了…
-
流媒体web端播放技术有哪些?
目前流媒体的传统几大领域(安防、直播、视频会议)技术栈正在逐渐融合,技术边界越来越模糊,用户迫切的需要摆脱传统使用习惯的枷锁,在移动端、web端、小程序能随时随地的观看云端实时视频…
-
WebRTC 真实IP泄露防范
很多人可能误以为使用代理就可以完全隐藏我们的真实 IP 地址,但实际并不总是这样。事实上,有大量文章[1]指出,WebRTC 存在安全风险,「而 WebRTC 安全风险的可怕之处在…
-
深入分析各行业直播方案与原理
编者按:本文作者整理了各行业的直播方案与原理,包括直播基础知识、直播app实现流程、音视频处理流程,两个案例的直播原理和技术方案解析,对直播开发入门的朋友有帮助,特分享给大家。
-
什么是 CMAF Streaming? CMAF 是如何工作的
数字媒体行业正在迅速发展。在这个行业中,视频流代表了最具活力和增长最快的行业之一。该领域最先进的技术之一是 CMAF Streaming。它是一种创新的音频和视频文件格式,可实现跨…
-
苹果新专利曝光:智能指环可控制 XR 头显并进行交互
近日,美国专利商标局正式授予苹果一项专利,该专利涉及检测皮肤接触的系统和方法。更具体地说,是检测两只手或两根手指之间的接触,以便在 VR 或 AR 环境中输入。使用 VR 头显时,…
-
WebRTC泄露源IP的防范措施
据同事反馈某网站可以获取到请求来源真实IP,无论是机场还是自建(包括gost tls),都可以被探测出源IP。研究应该是WebRTC的问题,网站可以利用STUN服务器获取到本地的IP地址。简单解决方案,安装 WebRTC Leak Shield 扩展。
-
低延迟流式语音识别技术在人机语音交互场景中的实践
美团语音交互部针对交互场景下的低延迟语音识别需求,提出了一种全新的低出字延迟流式语音识别方案。本方法将降低延迟问题转换成一个知识蒸馏过程,极大地简化了延迟优化的难度,仅通过一个正则…
-
2023 年 MQTT Broker 技术选型时需要考虑的 7 个因素
MQTT Broker 是用于连接物联网设备,完成消息传递的重要组件。MQTT Broker 的技术选型,是物联网应用构建过程中最为基础也是最为关键的一步。本文将从物联网应用普遍场…
-
WHIP & WHEP:WebRTC 是直播的未来吗?
WHIP 和 WHEP 是让 WebRTC 进入直播的规范。但这真的是未来需要的吗? WebRTC 对于实时性来说是很好的,其他方面就不多说了。最近出现了两个新协议——WHIP 和…
-
视频分辨率如何影响视频质量?
视频分辨率是指构成视频图像的微小点(称为像素)的数量。它由视频的宽度和高度决定。例如,一个分辨率为 1024 X 768 的视频,其宽度为 1024 像素,上下为 768 像素。分…
-
python-ffmpeg 音视频处理库的安装和实操
python-ffmpeg 是一个基于 Python 的音视频处理库,它可以使用 FFmpeg 的各种功能来实现音视频的剪辑、转码、合成等操作。该库是由 FFmpeg 直接绑定的 …
-
点播体验优化:成本与体验的“非零和博弈”
随着移动互联网和智能终端的普及,越来越多的海内外互联网企业开始发力短视频业务。在短视频用户全球化,短视频产品及内容消费井喷式增长的今天,用户开始逐渐对体验有了越来越高的要求。为了更…
-
H264的编码帧类型(IDR帧、I帧、P帧或B帧)和帧结构
通常一个H264码流中包含了多个GOP(图像组),每一个GOP里面包含多个视频编码帧,如下图所示。GOP(Group of Pictures)图像组的意思。H264码流对GOP的划…