技术文章
-
Web 端实时防挡脸弹幕(基于机器学习)
防挡脸弹幕,即大量弹幕飘过,但不会遮挡视频画面中的人物,看起来像是从人物背后飘过去的。 机器学习已经火了好几年了,但很多人都不知道浏览器中也能运行这些能力; 本文介绍在视频弹幕方面…
-
RTC的发展历程及2023年趋势预测
本文分享者 Jonathan Christensen 已经在实时通信(RTC)行业工作了20余年。从在微软担任 RTC 的第一个 GPM 开始,Jonathan Christens…
-
Total-Recon:面向体视图合成的可变形场景重建
Total-Recon 是第一种从单目 RGBD 视频中逼真地重建可变形场景的方法。为了扩展到长视频,该方法将场景运动分层分解为每个对象的运动,而每个对象的运动本身又被分解为全身整…
-
音频文件PCM代码走读
紧接上篇文章音频格式PCM介绍,本文介绍PCM代码相关内容,废话不多说,干活奉上。 PCM采集 首先需要了解模拟信号采集过程。通过ADC(模数转换器)将模拟信号转换成数字信号。然后…
-
什么是视频带宽?了解视频带宽及其对观看体验的影响
什么是视频带宽? 当流媒体或观看视频时,视频带宽描述了每秒钟传输的数据量。了解视频带宽是至关重要的,因为它直接影响观看体验。在讨论视频带宽时,它通常与分辨率带宽相比较,后者是指视频…
-
中国算力网络发展评估体系研究
摘要:算力网络是一种智能化的新型网络,其基础设施包括通信网络和异构算力设施。通过整合多种资源,如数据、计算和网络等,进行编排管理,实现网络、算力、数据、运维、智能和服务的融合。高质…
-
车联网通信揭秘:CAN Bus 协议解读
什么是 CAN Bus? CAN(Control Area Network)总线是一种串行通信协议,能够让设备之间可靠而高效地传输数据。它广泛应用于车辆领域,像神经系统一样连接车辆…
-
开源音视频剪辑工具:FunASR-APP ClipVideo
视频剪辑是大家生活中经常使用的工具,现有的视频剪辑软件支持种类丰富的视频裁剪、编辑功能。对于一个长视频,剪辑出里面需要的视频片段,往往需要花费很长的时间来浏览视频,剪辑需要的音视频…
-
解密实时通话中基于 AI 的一些语音增强技术 | ICASSP 2023
背景介绍 实时音视频通信 RTC 在成为人们生活和工作中不可或缺的基础设施后,其中所涉及的各类技术也在不断演进以应对处理复杂多场景问题,比如音频场景中,如何在多设备、多人、多噪…
-
研究人员带来分析未标记音频和视频数据的新技术
来自麻省理工学院(MIT)、麻省理工-IBM沃森人工智能实验室(MIT-IBM Watson AI Lab)、IBM研究院(IBM Research)和其他机构的研究人员开发了一种…
-
IPv6是什么意思啊?IPv6相比IPv4有哪些优势
IPv6是什么意思 IPv6是英文“Internet Protocol Version 6”的缩写,是互联网工程任务组设计的用于替代IPv4的下一代IP协议,其地址数量号称可以为全…
-
PeekingDuck:计算机视觉框架
计算机视觉项目可能会非常令人望而生畏,涉及到各种工具和包,如OpenCV、TensorFlow和PyTorch等等。不仅需要熟悉所涉及的工具和API,还需要正确组合各个包,以使整个…
-
WebRTC服务中的背压
在软件的上下文中,背压是指系统为“推回”下行力量而采取的行动。因此,就是系统在受到胁迫,或在总调用模式表现出过多峰值,或过于突发时,单方面采取的一种防御性行动。 这种方法通常用于微…
-
WebRTC屏幕共享内容检测
WebRTC 的一个有趣的功能是能够为媒体轨道配置一个内容提示,以便 WebRTC 能够为该特定类型的内容优化传输。 这样,如果内容提示是 “文本”,它将尝…
-
实时通信 (RTC) 在多元宇宙中的作用
最近很多公司都在谈论他们通常称之为元宇宙的东西。对于什么是元宇宙没有一个明确的定义,但类似这样的东西听起来已经很接近了:”一个高度连接的环境,有很多互动的玩家和复杂的模…
-
uniapp音视频播放功能实现(uniapp音视频开发系列8)
uniapp应用程序播放音频、背景音乐或视频,需要媒体播放器组件提供支持。本文分享即构的uniapp实时音视频SDK中的媒体播放器组件功能和实现。 媒体播放器功能简介 媒体播放器组…
-
WebRTC中不同类型的延迟测量
在构建 WebRTC 服务时,衡量用户体验的最重要指标之一是通信延迟。延迟很重要,因为它会影响会话交互性,还会影响使用重传(这是最常见的情况)时的视频质量,因为重传的有效性取决于您…
-
WebRTC RTP 标头扩展审查
WebRTC 支持 RTP 标头扩展的概念,以使用额外的元数据扩展媒体数据包。最常见的用例之一是将音频级别附加到音频数据包,这样服务器就可以计算活跃的说话者而无需解码音频数据包。 …
-
Asterisk SIP/RTP性能测试结果物理服务器支持4500呼叫并发
SIP媒体服务器的性能受限于很多呼叫和其它相关业务,系统资源等的影响。因为生产环境在不断发生变化,所以服务器的性能测试是一个永恒的话题。针对不同的用户群体,企业IPPBX的部署方式…
-
视频制作云容灾指南
灾难恢复 (DR) 计划对于电影制作或后期制作操作至关重要。没有这样的计划会导致灾难性数据丢失、声誉受损、客户关系受损以及费用增加的可能性。 云容灾是一种特别有效的容灾技术。云容灾…