技术文章
-
使用 WebRTC 从 ASP.NET Core 3.1 MVC 捕获视频
本文介绍如何使用 WebRTC 从 ASP.NET Core 3.1 MVC 应用程序使用网络摄像头捕获视频。 WebRTC(Web 实时通信)是一个免费的开源项目,它使 Web …
-
Base64 编码和解码
Base64是一种编码和解码方案,用于将二进制数据转换为可打印的 ASCII 文本格式,反之亦然。它通常用于在仅支持 ASCII 文本格式的介质上传输二进制数据。Base64 使用…
-
在 Android 中使用文字转语音
文本转语音 (TTS)是一种辅助技术,用于将文本转换为合成语音。Text to Speech 是 Android 平台的内置功能。 在布局 XML 文件中,我们添加了EditTex…
-
视频RTMP推流方案(基于librtmp实现推流)
对应RTMP推流,业界有很多开源方案。如使用ffmpeg推流,librtmp(rtmp-dump),gstream推流。由于ffmpeg和gstreamer比较庞大,仅仅用来推流,…
-
windows平台桌面截屏技术(GDI, DDRAW和DXGI三种抓屏方式)
windows系统中,抓取屏幕有很多方法,比较常用的是GDI和mirror两种方式,除此以外,利用ddraw和DXGI(windows7以上系统支持)方式也可以抓取屏幕。由于mir…
-
多媒体文件格式M3U8剖析
“M3U” 和 “M3U8” 文件都是苹果公司使用的 HTTP Live Streaming(HLS) 协议格式的基础;是 Unic…
-
多媒体文件格式FLV剖析(FLV分析工具)
本文介绍一种常用的流式媒体格式,就是FLV,FLV全称为Flash Video,一听就知道是Adobe 公司推出的一种媒体封装格式。下面我们剖析一下FLV媒体的格式内容。 FLV分…
-
语音通话AI降噪技术
在日常生活中,噪声是影响语音通话质量的重要因素之一。语音降噪技术通过消除噪声并提取干净语音,从而提高语音质量和可懂度,在移动通信、耳机、会议系统、语音交互等应用中具有巨大价值。近年…
-
一文理清直播全过程(直播推流端和拉流端)
本文分享完整的直播需要的流程,理清主播到观众之间的交互过程,包括直播推流端和拉流端的具体步骤。 试想一下,主播在这边捧着手机,表演一番,然后粉丝们在另外一边拿着手机看得津津有味,其…
-
基于空中计算的应急通信网络中任务调度与无人机部署联合优化算法
Zhang T K, Chen C B, Xu Y, Loo J & Xu W J. Joint Task scheduling and mu…
-
视频云背后的硬核实力
算力时代,靠吃「硬件红利」便能搞定新应用场景的「甜蜜期」已经过去。 人类社会的每一次科技跃迁,其本质都是计算力的突破与演进。 算盘拨出农耕文明的繁荣,机械计算机催生出第一次工业革命…
-
研究人员为低成本轻量级机器人实现基于声音的定位和映射功能
蝙蝠具有在黑暗中行动的能力,即使它们无法在视觉上感知周围环境。这种能力基于它们发射的超声波产生独特的回波模式,提供有关附近感兴趣物体或障碍物位置的信息。 图片源于:Dümbgen …
-
解锁抖音世界杯的画质优化实践
卡塔尔世界杯已经结束,29天赛程,64场比赛,最终梅西带领阿根廷时隔三十六年再次捧杯。世界杯期间,抖音提供的稳定高质直播画面为观众带来了完美的观赛体验,决赛的PCU高达3700W+…
-
多智能体RL实现多轮连续交互,IteR-MRL使图像分割算法达到医用标准
如何提高交互式图像分割算法的效率?上海交大和华师大的研究者提出了一种基于多智能体深度强化学习的新型算法。 现有的交互式图像分割算法虽然能迭代式地更新分割结果,但很大程度上忽略了对连…
-
AI 看唇语,在嘈杂场景的语音识别准确率高达75%
事实上,研究表明视觉线索在语言学习中起着关键的作用。相比之下,人工智能语言识别系统主要是建立在音频上。而且需要大量数据来训练,通常需要数万小时的记录。 为了研究视觉效果,尤其是嘴部…
-
使用Incoming Webhooks 和 ESP8266 NodeMCU 向Slack频道发送消息
Slack是一种消息服务,允许与团队成员进行通信。Slack 允许创建频道,团队成员可以在其中发送消息和共享文件。Incoming Webhooks 是将消息从自定义应用程序发送到…
-
WebRTC术语(WebRTC常用名词)
WebRTC术语非常多,这里分析来自“给好奇者的WebRTC”给出的相关术语,欢迎大家继续补充。 ACK: Acknowledgment (确认报文) AVP: Audio and…
-
WebRTC Android端开发知识及开源项目
webrtc支持多个平台,比如ios、android,同时支持多款浏览器。本文分享webrtc 在 android 上是如何调用的。 WebRTC Android开发基础知识 在…
-
AVC 和 HEVC 的区别(AVC和HEVC哪个好)
在视频压缩中,两种流行的编解码器脱颖而出——AVC 和 HEVC,引发了 AVC 与 HEVC 的争论。AVC,也称为 H.264,十多年来一直是行业标准,但 HEVC,也称为 H…
-
MPEG2-TS流解析(音视频基础知识)
在音视频中,MPEG2-TS(简称TS)流是一种常用的复合流。几乎所有的流媒体协议都支持TS流,如:RTSP、UDP、SRT等。 TS流的结构介绍 TS流支持的三层结构: 他分别是…