技术文章
-
移动边缘云计算网络中基于推荐的边缘缓存的联邦深度强化学习丨论文分享
1 研究背景 目前,大量终端设备接入互联网以在无线网络中实现各种服务和应用(如内容访问、虚拟导航/管理和环境监测),这不可避免地导致严重的骨干网络拥塞,并降低用户的服务质量。 为了…
-
使用 C++ 和 GStreamer 将 RTMP 推流到本地
之前文章《使用GStreamer将网络摄像头数据传输到RTMP服务器》展示了如何将本地网络摄像头流式传输到 RTMP 服务器,这次我将向您展示如何使用 C++ 和 GStreame…
-
InstructPix2Pix: 用于图像编辑的动态扩散模型 | CVPR 2023
这篇论文提出了一种协作扩散模型,无需重新训练已有的单模态扩散模型便可实现多模态的人脸合成与编辑。具体而言,作者提出了动态扩散器,这个扩散器通过预测每个预训练的单模态模型的空间-时间…
-
微软推出 Hierarchical Transformer 实现更高准确率的语音评测
对于语言学习者来说,练习发音并获得及时准确的反馈,是提高口语水平的重要环节。多年来,微软一直深耕基于 Azure 认知服务的语音功能,不断优化语音评测[1]功能的底层技术,从准确率…
-
Meta VR专利探索根据肢体动作来启动调用体育App应用
在XR沉浸式现实中,允许用户轻松方便地启动生成相关应用程序是一个问题,比如说体育领域。在名为“Motion-based generation of applications in …
-
主流WebRTC的SIP支持包评价:SIP.js,Js SIP, SIP ML5和QuoffeSIP对比,js sip得分最高
WebRTC是目前和SIP进行完美结合的典范,同时能够极大增加用户浏览器应用场景,通过浏览器实现了很多用户的需求,例如页面集成呼叫功能,对接其它终端设备等。目前,因为浏览器的兼容性…
-
容器格式(MP4、CMAF、MPEG-TS、Matroska)通用指南
容器格式是一种将多个数据流嵌入到单个文件中的方式,常用于在线视频、下载电影或使用流媒体服务中。常见的容器格式包括MP4、MKV、AVI和MOV等。本文从基本的专业术语到各种容器文件…
-
为什么我们能判断声音的远近 – 初始时间延迟差的作用
在文章(为什么我们能判断声音的远近)中我们说到,在听觉信号中存在着一些线索可以供我们来判断声源的距离远近。这篇文章就以其中的一个线索–初始时间延迟差为例,来介绍应该如何…
-
海量视频处理的应对和算法实践
随着短视频、直播、智慧城市、5G等的快速发展,视频内容铺天盖地,五花八门,相应的处理需求也多种多样。如何能高效地应对?需要在数据处理系统,底层计算能力,以及算法研究等多方面协同努力…
-
使用 Python 生成视频帧
任务 我们要解决的问题陈述非常容易理解。我们需要访问设备的摄像头。我们的工作是编写一段代码,从摄像机捕获视频,获取视频的每一帧,将其保存在我们的设备上,这样当我们打开所需的文件夹时…
-
最新SIP-over-QUIC: Session Initiation Protocol over QUIC和RTP传输概论
互联网自诞生以来,其用户群一直保持着持续上升的趋势,并且随着内容不断增加,从文本到视频的需求也要求更实时的传输,流量增长更为明显。根据思科视觉网络指数™(VNI)的发布,这种趋势成…
-
使用OpenCV进行肺炎诊断检测
肺炎是一种由感染引起的严重呼吸道疾病,特别是在高危人群中,可能会出现危及生命的并发症。必须尽快诊断和治疗肺炎,以最大限度地提高患者康复的机会。 诊断过程并不容易,需要一些医学实验室…
-
通过“感算共融”架构打破智能感知应用的能量效率壁垒 | 清华大学杨兴华,乔飞等
研究意义 近年来,智能感知应用在人们的生活中扮演着越来越重要的角色。然而,随着智能设备的普及和应用场景的增加,传统的感知架构已经无法满足高能效、低成本和高精度的要求。因此,如何提高…
-
DeepRS:用于实时视频通信的基于深度学习的网络自适应 FEC
以往的自适应 FEC 都简单地将历史网络模式作为对未来模式的预测,而忽略了历史与未来之间可能存在的复杂关系。为了充分利用历史和未来之间的上下文关系,我们提出了一种新的 FEC 算法…
-
SparseNeRF: 通过提取深度排序信息提升稀疏视角的合成效果
这篇文章提出了从预训练深度模型中提取局部深度排序先验信息。有了该约束,SparseNeRF显著提升了NeRF在稀疏视角输入场景下的表现。此外,为了保持场景的连续几何结构,还提出了一…
-
直播应用中的高并发场景思考
本文主要总结下自己在直播领域中实践所遇到过的一些高并发技术问题,以及相关的解决思路。 其实在直播这类业务中,对于系统的实时性要求是非常高的,例如直播间里面的大哥送了某个礼物之后,要…
-
uniapp音视频通话示例源码运行指引(uniapp音视频开发系列1)
Uniapp 是一个使用 Vue.js 开发所有前端应用的框架,开发者编写一套代码,可发布到iOS、Android、Web(响应式)、以及各种小程序、快应用等多个平台。目前有900…
-
如何从SRS服务器拉HTTP-FLV流
http-flv技术的实现 HTTP协议中有个约定:content-length字段,http的body部分的⻓度服务器回复http请求的时候如果有这个字段,客户端就接收这个⻓度的…
-
如何从 SRS 服务器拉 RTMP 流
本文介绍如何从SRS服务器拉RTMP流。 SrsRtmpConn::stream_service_cycle 客户端从SRS服务器拉流主要逻辑入口在SrsRtmpConn::str…
-
GStreamer C++ 通过 TCP 流式传输网络摄像头教程
在本教程中,将向你展示如何使用本地的 GStreamer(C++) 通过 TCP 流式传输用户的网络摄像头。 要求 GStreamer 安装将取决于你的环境等。可以通过以下方式找到…