技术文章
-
如何在 Chrome、Firefox、Safari 和 Opera 中禁用 WebRTC
在本文中,我们将向您展示如何在最流行的操作系统的各种浏览器中禁用 WebRTC。 WebRTC 是什么以及它是如何工作的 WebRTC 表示 Web 实时通信。该协议是一种开放标准…
-
初探XR虚拟制作技术及其在电视制播中的应用
摘要:本文从LED显示屏、摄像机跟踪系统、图形渲染引擎三方面阐述了XR虚拟制作的技术基础,并结合XR虚拟演播室业务实践,探讨了XR虚拟演播室实现技术、基本流程和方案选型。 作者:广…
-
2023年总台竖屏春晚技术创新应用及实践
摘要:2023年总台竖屏春晚在腾讯视频号、央视频、央视新闻等播出端圆满呈现,本次竖屏春晚在采集端、制作端、传输端、呈现端实现端到端高清HDR 50P+双耳渲染菁彩声效果。本文介绍了…
-
流媒体web端播放技术有哪些?
目前流媒体的传统几大领域(安防、直播、视频会议)技术栈正在逐渐融合,技术边界越来越模糊,用户迫切的需要摆脱传统使用习惯的枷锁,在移动端、web端、小程序能随时随地的观看云端实时视频…
-
WebRTC 真实IP泄露防范
很多人可能误以为使用代理就可以完全隐藏我们的真实 IP 地址,但实际并不总是这样。事实上,有大量文章[1]指出,WebRTC 存在安全风险,「而 WebRTC 安全风险的可怕之处在…
-
深入分析各行业直播方案与原理
编者按:本文作者整理了各行业的直播方案与原理,包括直播基础知识、直播app实现流程、音视频处理流程,两个案例的直播原理和技术方案解析,对直播开发入门的朋友有帮助,特分享给大家。
-
什么是 CMAF Streaming? CMAF 是如何工作的
数字媒体行业正在迅速发展。在这个行业中,视频流代表了最具活力和增长最快的行业之一。该领域最先进的技术之一是 CMAF Streaming。它是一种创新的音频和视频文件格式,可实现跨…
-
苹果新专利曝光:智能指环可控制 XR 头显并进行交互
近日,美国专利商标局正式授予苹果一项专利,该专利涉及检测皮肤接触的系统和方法。更具体地说,是检测两只手或两根手指之间的接触,以便在 VR 或 AR 环境中输入。使用 VR 头显时,…
-
WebRTC泄露源IP的防范措施
据同事反馈某网站可以获取到请求来源真实IP,无论是机场还是自建(包括gost tls),都可以被探测出源IP。研究应该是WebRTC的问题,网站可以利用STUN服务器获取到本地的IP地址。简单解决方案,安装 WebRTC Leak Shield 扩展。
-
低延迟流式语音识别技术在人机语音交互场景中的实践
美团语音交互部针对交互场景下的低延迟语音识别需求,提出了一种全新的低出字延迟流式语音识别方案。本方法将降低延迟问题转换成一个知识蒸馏过程,极大地简化了延迟优化的难度,仅通过一个正则…
-
2023 年 MQTT Broker 技术选型时需要考虑的 7 个因素
MQTT Broker 是用于连接物联网设备,完成消息传递的重要组件。MQTT Broker 的技术选型,是物联网应用构建过程中最为基础也是最为关键的一步。本文将从物联网应用普遍场…
-
WHIP & WHEP:WebRTC 是直播的未来吗?
WHIP 和 WHEP 是让 WebRTC 进入直播的规范。但这真的是未来需要的吗? WebRTC 对于实时性来说是很好的,其他方面就不多说了。最近出现了两个新协议——WHIP 和…
-
视频分辨率如何影响视频质量?
视频分辨率是指构成视频图像的微小点(称为像素)的数量。它由视频的宽度和高度决定。例如,一个分辨率为 1024 X 768 的视频,其宽度为 1024 像素,上下为 768 像素。分…
-
python-ffmpeg 音视频处理库的安装和实操
python-ffmpeg 是一个基于 Python 的音视频处理库,它可以使用 FFmpeg 的各种功能来实现音视频的剪辑、转码、合成等操作。该库是由 FFmpeg 直接绑定的 …
-
点播体验优化:成本与体验的“非零和博弈”
随着移动互联网和智能终端的普及,越来越多的海内外互联网企业开始发力短视频业务。在短视频用户全球化,短视频产品及内容消费井喷式增长的今天,用户开始逐渐对体验有了越来越高的要求。为了更…
-
H264的编码帧类型(IDR帧、I帧、P帧或B帧)和帧结构
通常一个H264码流中包含了多个GOP(图像组),每一个GOP里面包含多个视频编码帧,如下图所示。GOP(Group of Pictures)图像组的意思。H264码流对GOP的划…
-
基于图注意力机制的音频语意概述 | IEEE SPL
音频语意概述是一项跨模态音频内容理解任务,旨在通过自然语言描述音频信号蕴含信息,使机器具备理解表达音频场景事件语意内容的能力。现有的主流音频语意概述方法几乎均采用在AudioSet…
-
IM专题:分层架构IM系统(17)—未读数逻辑实现
在 IM 系统中,“未读数” 是一个非常核心的概念。 首先,从产品体验上,用户登录之后,往往是由消息 “未读数” 引导用户后续的操作;其次,“未读数” 实现逻辑直接影响了上层业务的…
-
UV 体积:可编辑人体自由视角的实时渲染 | CVPR 2023
神经体积渲染使得在自由视角下进行逼真的人体表现成为沉浸式 VR / AR 应用的关键任务,但是渲染过程中的高计算成本限制了其实际应用。为解决这一问题,作者提出了一种新的方法,称为“…
-
基于AIGC的3D场景创作引擎概述
通过改变3D场景制作流程复杂、成本高、门槛高、流动性差的现状,让商家像玩转2D一样去玩转3D,让普通消费者也能参与到3D内容创作和消费中,真正实现内容生产模式从PGC/UGC过渡到…