技术文章
-
用TypeScript探索媒体设备信息
在涉及媒体处理的网络应用中,获得可用的输入和输出设备(如麦克风、相机和耳机)的信息至关重要。这使得开发人员能够为用户提供量身定制的媒体体验。在这篇文章中,我们将探讨一个使用navi…
-
元宇宙中的实时通话
在当今快速发展的技术环境中,虚拟通信已成为新常态。虚拟现实 (VR) 和增强现实 (AR) 的出现彻底改变了用户见面和聚会的方式。随着视频会议 (VC) 软件的广泛采用,远程通信变…
-
字节跳动提出高性能 transformer 推理库,获 IPDPS 2023 最佳论文奖
字节跳动与英伟达, 加州大学河滨分校联合发表的论文 《ByteTransformer: A High-Performance Transformer Boosted for Var…
-
元宇宙中的实时音频:REAL-TIME AUDIO AT META SCALE
本文将涵盖在 Meta 旗下的应用程序包括 Messenger、Instagram、Facebook 和 WhatsApp 中为用户提供可靠且高质量的音频体验所需的要素,以应对各种…
-
iOS如何实现画中画模式?
本文我们将介绍 iOS 上的画中画实现和特点。画中画 (PiP) 模式允许用户在其他窗口之上的浮动窗口中观看视频。他们可以在屏幕上移动它并放置在任何方便的地方。此功能使用户能够在与…
-
tcp和udp有何主要区别?tcp和udp是如何工作的
对于TCP协议和UDP协议,大家应该都有所耳闻。TCP协议和UDP协议都工作在传输层,他们的目标都是在应用之间传输数据。我们常用的网络通信,比如浏览网页,查看邮件,电话通信等,都是…
-
走向实用的AI编解码
基于AI的端到端数据压缩方法受到越来越多的关注,研究对象已经包括图像、视频、点云、文本、语音和基因组等,其中AI图像压缩的研究最为活跃。图像编解码的研究和应用历史悠久,AI方法要达…
-
远程工作的未来: 用WebRTC和机器学习释放AI驱动的通信
最近,一个想法在我脑海中闪现,一个将WebRTC和机器学习这两个技术巨头合并的概念。随着我开始了解这种合并的能力,我变得越来越兴奋。我意识到,我不仅仅是把机器学习带回了我的生活,而…
-
如何在Kubernetes上实现分布式和可自动扩展的WebSocket服务器架构
WebRTC信令:一个类似于 “即时聊天 “的用例 作为我们在Lumen的Mesh交付技术的开发工作的一部分,我们需要设计和实现一个有弹性和可扩展的后端架构…
-
AVS感知无损压缩标准取得重要进展
AVS感知无损压缩(PLC,Perceptual Lossless Compression)标准制定工作自2021年12月启动,针对8K+超高清视频信号传输中高速数据收发的性能瓶颈…
-
WebSocket + Node.js实现一对一聊天室
本文将为大家介绍即时通讯技术 WebSocket的基本原理,并且讲解一个基于WebSocket + Node.js实现简易的一对一实时聊天的案例。 WebSocket是一种HTML…
-
聊聊做 NeRF-3D重建性能优化经历
本文作者尘漠加入大淘宝到现在也有5年了,一路走来很开心,他认为在这里可以让他静心做技术研究。以下是尘漠的自述—— 在淘宝前三年,我主要偏向研究 2d计算机视觉算法,相比于研究GAN…
-
优化WebRTC回声消除过程:舒适噪声生成算法的应用与原理
在回声消除中,舒适噪声生成(Comfort Noise Generator,CNG)算法是一种常用的技术,它被用来减轻回声消除过程中产生的不适感和声音失真。舒适噪声生成算法通过添加…
-
利用 eKuiper 与 EMQX 实现车联网 CAN Bus 数据实时流处理
在之前的文章中,我们对车联网 CAN Bus 协议进行了详细解读,同时介绍了目前 CAN Bus 数据在实时采集与处理中面临的挑战。我们也针对这些挑战提出了一个可行的方案:利用开源…
-
对话钉钉音视频专家冯津伟:大模型不是万能的
在音视频技术领域,ICASSP 大会是行业的风向标会议,也是语音学界从业者研究下一代技术发展的盛宴。近期,国内外各大企业陆陆续续放出论文入顶会的消息,钉钉蜂鸣鸟音频实验室 2 篇论…
-
WebRTC 和 AI:创新和影响的交集
向我们这一代人的前瞻性思维打招呼! 我是WebRTC先生,这是我在实时音视频通信和游戏流方面的历程的证明。作为一名经验丰富的WebRTC工程师和人工智能研究科学家,我亲身经历了这两…
-
如何用WebRTC和Socket.IO实现共享屏幕?
我们可以在几乎所有的会议应用程序中找到共享屏幕。这些应用程序可以是本机应用程序,也可以只是Web应用程序。有了屏幕共享权限,你的Web应用可以捕捉你的浏览器标签或整个屏幕。而且,你…
-
在 JavaScript 中捕捉摄像头/麦克风
在浏览器中直接捕捉摄像头和麦克风的能力已经彻底改变了Web开发,实现了沉浸式的用户体验和广泛的应用,从摄像头会议到增强现实。利用 getUserMedia API,你可以访问用户的…
-
音频格式–MP3格式介绍
发展背景MP3 技术的起源在 Hans Musmann 教授的一篇论文中进行了全面描述。在 80 年代末和 1990 年代初由德国弗劳恩霍夫协会的一组工程师在 Karlheinz …
-
WebTransport:实时通信的未来,弥合 WebRTC 之外的鸿沟
你听说过WebTransport吗?这是一个全新的网络标准,将彻底改变数据在客户端和服务器之间的传输方式。让我用简单的语言为你分析一下。 WebTransport 是一个新协议,在…