技术文章
-
RTC实时音视频中实时翻译的重要性
在当今互联互通的世界里,信息和内容的传播速度比以往任何时候都快。然而,语言仍然是一个主要障碍,阻碍了交流,限制了受众范围。实时翻译弥补了这一差距,为不懂原文的观众提供了无缝体验。 …
-
什么是 GStreamer?Gstreamer 和 FFmpeg 哪个好
GStreamer 是一个基于管道的开源多媒体框架,可将各种媒体处理系统连接起来,完成复杂的工作流程。它支持创建多种类型的媒体应用程序,包括视频编辑器、媒体播放器、转码系统,也可用…
-
SIP 中继、PRI 和 BRI 有什么区别?
多年前,会话发起协议中继(SIP 中继)非常流行,因为与主速率接口(PRI)和基本速率接口(BRI)相比,它具有很大的成本优势。但是,SIP 中继、PRI 和 BRI 之间有哪些技…
-
淘宝短视频流工程重构(上):理论篇
随着视频流业务的发展,业务的复杂性越来越高,视频流老工程在架构设计、代码质量、工程能力等方面的问题也逐渐凸显。在这样的背景下我们开启了一次对老工程的大型重构。 本次重构是一次对大型…
-
实时音频同步(第 1 部分)
实时同步技术错综复杂,它一直是一个令我着迷的课题。今天,我想与大家分享我构建一个系统的方法,这个系统可以在位于不同物理区域的设备之间实时同步音频。 试想一下,我们在一个家庭的多个房…
-
使用 Vue.js 和 WebSockets 创建实时聊天应用程序
本文将讲解设置 Vue.js 项目、集成 Socket.io 用于 WebSocket 通信以及创建实时聊天应用程序。这些基础知识可以扩展到各种实时应用程序,如协作工具、实时更新和…
-
掌握 WebRTC:构建实时视频聊天应用程序
本文我们将使用 WebRTC 从零开始创建一个实用的视频聊天应用程序。无论您是经验丰富的开发人员还是好奇的初学者,本指南都将让您掌握利用 WebRTC 进行实时通信的知识。 什么是…
-
完整实现迷你VGG网络进行图像识别
VGG网络是最流行的图像识别技术之一的基础。学习它是值得的,因为它打开了许多可能性。要理解VGGNet,你需要了解卷积神经网络(CNN)。 在本文中,我们将仅关注VGGNet的实现…
-
RTC 将成 AGI 远程实时互动的必备能力
OpenAI 在春季发布会上发布的最新旗舰大模型 GPT-4o,在前代 GPT-4 只能理解和输出文本信息的基础上,GPT-4o 能支持低延迟的实时对话,“o”是Omni…
-
Asterisk 终极指南:构建通信应用程序的免费开源框架
欢迎来到 Asterisk 终极指南,Asterisk 是一种重塑企业全球通信方式的尖端开源框架。如果您想深入了解 Asterisk 解决方案的世界,或者想知道如何通过专业的 As…
-
WebRTC 和 RTSP 协议的区别及选择策略
您是否需要帮助以确保在业务中实现无缝视频和音频传输?随着数字通信日益复杂,流媒体协议的选择会对企业的实时交互能力和媒体处理产生重大影响。在 WebRTC(Web Real-Time…
-
WirelessLLM: 面向无线智能的通信大模型
大家好!今天给大家介绍我们团队最新的研究成果《WirelessLLM: Empowering Large Language Models Towards Wireless Inte…
-
WebSocket 创建聊天应用中的房间和消息持久化
离开教师岗位之前,我注意到有一大批学生在数字交流方面遇到困难。受此启发,我创建了一个聊天应用程序,它可以存储信息,供教师日后查看,以便向学生提供反馈或评分。由于我们的交流越来越数字…
-
MiroTalk:免费开源视频会议平台
在数字通信至关重要的时代,找到合适的视频会议平台可以改变游戏规则。 MiroTalk是一个开源解决方案,凭借基于浏览器的实时视频通话和大量创新功能,MiroTalk 成为满足各种通…
-
解锁实时通信:利用 WebRTC 在 React 和 Node 中掌握点对点视频通话!
想象一下,自由软件开发员 Sarah 正在开发一个雄心勃勃的项目——为远程医疗应用程序提供无缝视频通话功能。她面临的挑战是如何在不依赖第三方服务的情况下集成实时视频通信。经过几天的…
-
猫耳 WebSocket 跨端优化实践
在现代的移动应用程序中,长连接是一种不可或缺的能力,包括但不限于推送、实时通信、信令控制等常见场景。在猫耳FM的直播业务中,我们同样使用了 WebSocket …
-
如何在广播中平衡比特率、延迟和质量
数字化转型促使广播行业重新思考其工作流程并进行创新,随着该行业继续向 IP 基础设施过渡,许多公司正在采用新技术。流媒体已经在广播行业掀起了一场风暴,据说现在已经超过了传统的电视和…
-
IP承载网络技术演进方向研究
互联网业务的快速发展对IP承载网络提出了确定性、高可靠性、大带宽、弹性连接等新要求,而运营商业务本身的发展对IP承载网络提出了降本增效、差异化承载、安全可信的需求。基于业务演进对网…
-
VideoMAE:掩蔽自编码器是自监督视频预训练的高效数据学习器 | NeurIPS 2022
通常需要在超大规模的数据集上对Vision Transformer(ViT)进行预训练,以在相对较小的数据集上实现更好的性能。在本文中,作者证明了视频掩蔽自编码器(VideoMAE…
-
探索Camera ImageReader YUV420_888 快速转bitmap argb888的方式
从 Android 12 开始,RenderScript API 已被弃用。 Google推荐使用更加高效的Vulkan。 不过这篇文件还是介绍RenderSc…