技术文章

技术文章

微软推出 Hierarchical Transformer 实现更高准确率的语音评测

对于语言学习者来说，练习发音并获得及时准确的反馈，是提高口语水平的重要环节。多年来，微软一直深耕基于 Azure 认知服务的语音功能，不断优化语音评测[1]功能的底层技术，从准确率…

音频技术
2023年5月22日
技术文章

Meta VR专利探索根据肢体动作来启动调用体育App应用

在XR沉浸式现实中，允许用户轻松方便地启动生成相关应用程序是一个问题，比如说体育领域。在名为“Motion-based generation of applications in …

虚拟现实
2023年5月22日
WebRTC

主流WebRTC的SIP支持包评价：SIP.js，Js SIP, SIP ML5和QuoffeSIP对比，js sip得分最高

WebRTC是目前和SIP进行完美结合的典范，同时能够极大增加用户浏览器应用场景，通过浏览器实现了很多用户的需求，例如页面集成呼叫功能，对接其它终端设备等。目前，因为浏览器的兼容性…

webrtc学习和实践
2023年5月22日
技术文章

容器格式(MP4、CMAF、MPEG-TS、Matroska)通用指南

容器格式是一种将多个数据流嵌入到单个文件中的方式，常用于在线视频、下载电影或使用流媒体服务中。常见的容器格式包括MP4、MKV、AVI和MOV等。本文从基本的专业术语到各种容器文件…

大厂Animal
2023年5月22日
技术文章

为什么我们能判断声音的远近 – 初始时间延迟差的作用

在文章（为什么我们能判断声音的远近）中我们说到，在听觉信号中存在着一些线索可以供我们来判断声源的距离远近。这篇文章就以其中的一个线索–初始时间延迟差为例，来介绍应该如何…

音频技术
2023年5月22日
技术文章

海量视频处理的应对和算法实践

随着短视频、直播、智慧城市、5G等的快速发展，视频内容铺天盖地，五花八门，相应的处理需求也多种多样。如何能高效地应对？需要在数据处理系统，底层计算能力，以及算法研究等多方面协同努力…

视频技术
2023年5月22日
技术文章

使用 Python 生成视频帧

任务我们要解决的问题陈述非常容易理解。我们需要访问设备的摄像头。我们的工作是编写一段代码，从摄像机捕获视频，获取视频的每一帧，将其保存在我们的设备上，这样当我们打开所需的文件夹时…

视频技术
2023年5月22日
技术文章

最新SIP-over-QUIC: Session Initiation Protocol over QUIC和RTP传输概论

互联网自诞生以来，其用户群一直保持着持续上升的趋势，并且随着内容不断增加，从文本到视频的需求也要求更实时的传输，流量增长更为明显。根据思科视觉网络指数™（VNI）的发布，这种趋势成…

RTC观主
2023年5月22日
技术文章

使用OpenCV进行肺炎诊断检测

肺炎是一种由感染引起的严重呼吸道疾病，特别是在高危人群中，可能会出现危及生命的并发症。必须尽快诊断和治疗肺炎，以最大限度地提高患者康复的机会。诊断过程并不容易，需要一些医学实验室…

图像处理
2023年5月22日
技术文章

通过“感算共融”架构打破智能感知应用的能量效率壁垒 | 清华大学杨兴华,乔飞等

研究意义近年来，智能感知应用在人们的生活中扮演着越来越重要的角色。然而，随着智能设备的普及和应用场景的增加，传统的感知架构已经无法满足高能效、低成本和高精度的要求。因此，如何提高…

RTE基础设施
2023年5月22日
实时音视频

DeepRS：用于实时视频通信的基于深度学习的网络自适应 FEC

以往的自适应 FEC 都简单地将历史网络模式作为对未来模式的预测，而忽略了历史与未来之间可能存在的复杂关系。为了充分利用历史和未来之间的上下文关系，我们提出了一种新的 FEC 算法…

大厂Animal
2023年5月22日
技术文章

SparseNeRF: 通过提取深度排序信息提升稀疏视角的合成效果

这篇文章提出了从预训练深度模型中提取局部深度排序先验信息。有了该约束，SparseNeRF显著提升了NeRF在稀疏视角输入场景下的表现。此外，为了保持场景的连续几何结构，还提出了一…

图像处理
2023年5月20日
即时通讯

直播应用中的高并发场景思考

本文主要总结下自己在直播领域中实践所遇到过的一些高并发技术问题，以及相关的解决思路。其实在直播这类业务中，对于系统的实时性要求是非常高的，例如直播间里面的大哥送了某个礼物之后，要…

直播技术
2023年5月20日
实时音视频

uniapp音视频通话示例源码运行指引(uniapp音视频开发系列1)

Uniapp 是一个使用 Vue.js 开发所有前端应用的框架，开发者编写一套代码，可发布到iOS、Android、Web（响应式）、以及各种小程序、快应用等多个平台。目前有900…

ZEGO即构科技
2023年5月19日
技术文章

如何从SRS服务器拉HTTP-FLV流

http-flv技术的实现 HTTP协议中有个约定：content-length字段，http的body部分的⻓度服务器回复http请求的时候如果有这个字段，客户端就接收这个⻓度的…

RTC观主
2023年5月19日
技术文章

如何从 SRS 服务器拉 RTMP 流

本文介绍如何从SRS服务器拉RTMP流。 SrsRtmpConn::stream_service_cycle 客户端从SRS服务器拉流主要逻辑入口在SrsRtmpConn::str…

RTC观主
2023年5月19日
技术文章

GStreamer C++ 通过 TCP 流式传输网络摄像头教程

在本教程中，将向你展示如何使用本地的 GStreamer(C++) 通过 TCP 流式传输用户的网络摄像头。要求 GStreamer 安装将取决于你的环境等。可以通过以下方式找到…

RTC观主
2023年5月19日
技术文章

利用预测资源分配进行大容量传输，何时增益较大？

研究意义通过预测网络未来信息（如用户轨迹、网络流量等），并基于未来信息进行网络资源预先分配能够有效地提高网络资源利用率，从而提升网络性能（如系统能效、谱效等）。在现有工作中，对于…

RTE基础设施
2023年5月19日
技术文章

完美的交互式广播架构

虽然我们有时会泛泛地谈论低延迟或交互式广播，但重要的是要注意，实际上有两种不同类型的流媒体用例，需要不同程度的交互性。对话用例有特定的要求。例如，它要求有效地同步多个流，只在说话…

RTC观主
2023年5月19日
技术文章

SRS流媒体服务器拉流消息处理

本文分享从SRS流媒体服务器拉流消息处理流程。从SRS流媒体服务器拉流消息处理概述 1. 整体播放流程： 2. 从srs流媒体服务器拉RTMP流wiresharek抓包如下： R…

RTC观主
2023年5月19日