技术文章
-
多媒体文件格式M3U8剖析
“M3U” 和 “M3U8” 文件都是苹果公司使用的 HTTP Live Streaming(HLS) 协议格式的基础;是 Unic…
-
多媒体文件格式FLV剖析(FLV分析工具)
本文介绍一种常用的流式媒体格式,就是FLV,FLV全称为Flash Video,一听就知道是Adobe 公司推出的一种媒体封装格式。下面我们剖析一下FLV媒体的格式内容。 FLV分…
-
语音通话AI降噪技术
在日常生活中,噪声是影响语音通话质量的重要因素之一。语音降噪技术通过消除噪声并提取干净语音,从而提高语音质量和可懂度,在移动通信、耳机、会议系统、语音交互等应用中具有巨大价值。近年…
-
一文理清直播全过程(直播推流端和拉流端)
本文分享完整的直播需要的流程,理清主播到观众之间的交互过程,包括直播推流端和拉流端的具体步骤。 试想一下,主播在这边捧着手机,表演一番,然后粉丝们在另外一边拿着手机看得津津有味,其…
-
基于空中计算的应急通信网络中任务调度与无人机部署联合优化算法
Zhang T K, Chen C B, Xu Y, Loo J & Xu W J. Joint Task scheduling and mu…
-
视频云背后的硬核实力
算力时代,靠吃「硬件红利」便能搞定新应用场景的「甜蜜期」已经过去。 人类社会的每一次科技跃迁,其本质都是计算力的突破与演进。 算盘拨出农耕文明的繁荣,机械计算机催生出第一次工业革命…
-
研究人员为低成本轻量级机器人实现基于声音的定位和映射功能
蝙蝠具有在黑暗中行动的能力,即使它们无法在视觉上感知周围环境。这种能力基于它们发射的超声波产生独特的回波模式,提供有关附近感兴趣物体或障碍物位置的信息。 图片源于:Dümbgen …
-
解锁抖音世界杯的画质优化实践
卡塔尔世界杯已经结束,29天赛程,64场比赛,最终梅西带领阿根廷时隔三十六年再次捧杯。世界杯期间,抖音提供的稳定高质直播画面为观众带来了完美的观赛体验,决赛的PCU高达3700W+…
-
多智能体RL实现多轮连续交互,IteR-MRL使图像分割算法达到医用标准
如何提高交互式图像分割算法的效率?上海交大和华师大的研究者提出了一种基于多智能体深度强化学习的新型算法。 现有的交互式图像分割算法虽然能迭代式地更新分割结果,但很大程度上忽略了对连…
-
AI 看唇语,在嘈杂场景的语音识别准确率高达75%
事实上,研究表明视觉线索在语言学习中起着关键的作用。相比之下,人工智能语言识别系统主要是建立在音频上。而且需要大量数据来训练,通常需要数万小时的记录。 为了研究视觉效果,尤其是嘴部…
-
使用Incoming Webhooks 和 ESP8266 NodeMCU 向Slack频道发送消息
Slack是一种消息服务,允许与团队成员进行通信。Slack 允许创建频道,团队成员可以在其中发送消息和共享文件。Incoming Webhooks 是将消息从自定义应用程序发送到…
-
WebRTC术语(WebRTC常用名词)
WebRTC术语非常多,这里分析来自“给好奇者的WebRTC”给出的相关术语,欢迎大家继续补充。 ACK: Acknowledgment (确认报文) AVP: Audio and…
-
WebRTC Android端开发知识及开源项目
webrtc支持多个平台,比如ios、android,同时支持多款浏览器。本文分享webrtc 在 android 上是如何调用的。 WebRTC Android开发基础知识 在…
-
AVC 和 HEVC 的区别(AVC和HEVC哪个好)
在视频压缩中,两种流行的编解码器脱颖而出——AVC 和 HEVC,引发了 AVC 与 HEVC 的争论。AVC,也称为 H.264,十多年来一直是行业标准,但 HEVC,也称为 H…
-
MPEG2-TS流解析(音视频基础知识)
在音视频中,MPEG2-TS(简称TS)流是一种常用的复合流。几乎所有的流媒体协议都支持TS流,如:RTSP、UDP、SRT等。 TS流的结构介绍 TS流支持的三层结构: 他分别是…
-
H264码率控制模式(CBR、VBR和AVBR控制模式)
什么是码率控制?码率控制是指通过调节图像的压缩比例,从而决定输出编码码率的过程。在音视频领域,码率控制模式有着举足轻重的地位。 H264码率控制模式 H264码率控制模式分别有:C…
-
音频采样介绍(音视频基础知识)
声音是由物体振动产生的声波。是通过介质(空气或固体、液体)传播并能被人或动物听觉器官所感知的波动现象。最初发出振动(震动)的物体叫声源。声音以波的形式振动(震动)传播。声音是声波通…
-
多媒体文件格式MP4剖析(MP4识别工具)
MP4基本介绍 MP4格式是目前应用最广泛的封装格式,良好的跨平台特性是其最大的优势。我们有必要了解一下MP4的基本格式信息 ,方便我们封装裸流信息。 MP4中封装了视频或者音频裸…
-
非常好用的播放器视频渲染SDK
半年之前我写过一篇文章——为播放器外接一套渲染框架,本质就是通过OpenGL将视频的内容绘制在SurfaceView或者TextureView的画布上,实现控制视频渲染的作用,当时…
-
基于SD-WAN+互联网和JPEG-XS编码的远程制作测试
本文以JPEG-XS编码和SD-WAN+互联网技术为基础,通过一系列测试,探究远程制作中涉及的重要参数和解决方案。 作者:中央广播电视总台 王刚来源:选自2022年第11期《现代电…