技术文章
-
RTP 传输:应对真实网络
本文将介绍 RTP 数据包在现实世界中如何跨网络发送,以及随之而来的一些挑战。内容来自 Webex 的首席工程师和架构师 Rob Hanton 的分享。 RTP 传输 虽然大多数互…
-
Jitsi 技术架构深度分析以及挑战和未来扩展讨论
jitsi 是目前最流行的完整开源视频会议解决方案,用户可以非常便捷地部署在本地和云平台,实现自己的会议系统。其应用场景非常广泛。为了进一步了解Jitsi的技术架构和各种技术挑战,…
-
Agentic AI 和 AI Agents 的区别:技术深度剖析
人工智能已经从简单的基于规则的系统发展成为执行复杂任务的复杂、自主的实体。在此背景下经常出现的两个术语是 AI Agents 和 Agentic AI 。虽然它们看起来可以互换,但…
-
使用公网FRPS代理服务器实现远端WEBRTC-SIP终端和内网FreeSWITCH通信,详细部署和技术挑战讨论
分享关于使用FRPS实现的WEBRTC终端和内网FreeSWITCH的交互。
-
常见的 VoIP 音频质量问题及其解决方法
通话故障、延迟和音频失真不仅令人讨厌,还会破坏商务沟通。本文将列举一些常见的 VoIP 音频质量问题,如丢包、延迟和回音,以及消除这些问题的专业解决方案。
-
如何在分散的设备市场中大规模提供全球体育赛事直播
即使是在地区范围内大规模提供体育赛事直播,也意味着要应对分散的设备市场中的兼容性挑战,因为用户会在各种设备和平台上观看比赛,但对于全球体育赛事直播而言,当大量传统设备投入使用时,这…
-
使用 OpenSIPS 控制面板掌握自定义表格
OpenSIPS 控制面板是一款功能强大的工具,可通过用户友好的 Web 界面管理 OpenSIPS。它提供各种功能,可与 OpenSIPS 模块进行交互,同时利用数据库操作和管理…
-
Asterisk 如何集成 OpenAI Realtime
OpenAI火的一塌糊涂,各种应用都计划和OpenAI集成,完成AI智能化整合。开源项目的优势之一就是用户的创新意识,Asterisk开源用户也是如此。很多功能都是来自于用户的灵感…
-
多媒体 Elixir 开发人员实用指南
Elixir 是一种用于构建分布式、可扩展和可靠的多媒体应用程序的优秀语言。它基于 Erlang,而 Erlang 以同时处理大量事务而不会崩溃而著称。如果您正在处理视频流、图像处…
-
MainStreaming:关于弹性边缘交付以及大规模优化 QoS 和 QoE
从优质体育直播到一系列其他任务关键型应用程序,高效的内容交付对于大规模直播至关重要。边缘交付通过尽可能靠近最终用户广泛分发边缘注释,在全球范围内实现高性能流。 在 streamin…
-
IBM AI 发布 Granite 3.2 8B Instruct 和 Granite 3.2 2B Instruct 模型:提供实验性思维链推理功能
大型语言模型 (LLM) 利用深度学习技术来理解和生成类似人类的文本,这使得它们对于文本生成、问答、摘要和检索等各种应用都非常有用。虽然早期的 LLM 表现出了卓越的能力,但它们的…
-
EAGLES:轻量级编码的高效加速3D高斯 | ECCV 2024
最近,3DGS已经在新视角合成领域取得了巨大关注。它解决了NeRF训练时间过长、渲染速度过慢的问题。通过快速、可微的三维高斯光栅化,3DGS实现了实时渲染和加速训练。然而,由于在每…
-
简化自监督视觉:编码率正则化如何改变 DINO 和 DINOv2
从大量未标记的图像中学习有用的特征非常重要,DINO和DINOv2等模型就是为此而设计的。这些模型非常适合图像分类和分割等任务,但它们的训练过程很困难。一个关键挑战是避免表示崩溃,…
-
GPU 在 WebRTC 中的重要性:加速 AI、视频流和实时通信
图形处理器(GPU)最初设计用于加速游戏,使复杂的图形计算能够并行运行。中央处理器(CPU)擅长一次高精度地执行几条指令,而 GPU 则不同,GPU 专为大规模并行性而构建,可同时…
-
即时通讯应用程序的5个类型
即时通讯(又称IM、实时聊天、实时消息)彻底改变了我们的沟通方式,使我们能够在全球范围内进行基于文本的实时对话。即时通讯应用程序种类较多,本文将介绍其中五种主要类型,包括技术细节及…
-
Hugging Face 推出 FastRTC 以简化实时 AI 语音和视频应用
估值超过 40 亿美元的人工智能初创公司Hugging Face推出了FastRTC,这是一个开源 Python 库,它为开发人员在构建实时音频和视频人工智能应用程序时消除了一个重…
-
Hume 推出 Octave TTS:一种新的文本转语音模型,可根据定制的情绪创建自定义 AI 语音
在快速发展的数字通信领域,传统的文本转语音 (TTS) 系统往往难以捕捉到人类的全部情感和细微差别。传统系统往往以平淡、不变的语调“阅读”文本,而忽略了使人类语音如此引人入胜的微妙…
-
百万级群聊的设计实践
本文介绍了服务端在搭建 Web 版的百万人级别的群聊系统时,遇到的技术挑战和解决思路,内容包括:通信方案选型、消息存储、消息有序性、消息可靠性、未读数统计。 作者:来自 vivo …
-
.NET中的WebSocket:客户端-服务器实时通信指南
本文探讨了如何在 .NET 应用程序中实现 WebSocket 这一功能强大的全双工通信协议。本文包括设置 WebSocket 服务器、创建客户端以及使用 System.Net.W…
-
高解析度音频(Hi-Res Audio)是什么?
什么是 Hi-Res 音频?高分辨率音频(Hi-Res)指的是比传统格式(如 MP3 或标准 CD)提供更好音质的数字音乐文件。本文介绍了 Hi-Res 音频的格式、原理以及与其他音频的比较。