技术文章
-
使用 Kubernetes 编排边缘计算:架构、挑战和新兴解决方案
边缘计算已成为一种变革性方法,它使数据处理更接近数据源,不再依赖于集中式云基础设施。这对于要求低延迟、更高带宽效率和更高操作自主性的实时应用尤为重要。 Kubernetes 是一个…
-
200 万连接测试:EMQX WebSocket 性能深度解析
本文将带您深入探索 200 万连接背后的技术征程。我们将详细解读测试环境设置、各阶段结果以及实现这一卓越性能的 EMQX 架构原理。
-
Kamailio 中使用 nats 做路由分发
Kamailio 中如何使用 nats 做路由分发?Kamailio 作为一个开源的 SIP 服务器,NATS 作为一个性能极高的消息传递系统,两者的结合实现了高效的消息传递和事件处理。
-
从被动到主动:利用机器学习和 INT 预测网络拥塞
了解机器学习如何在网络拥塞发生之前进行预测。
-
现在搞 ffmpeg 有钱途吗?
从技术发展、行业需求和资金支持等角度来看,FFmpeg 作为音视频处理领域的核心开源项目,仍然具有较高的商业价值和职业发展潜力。 以下从多个维度详细分析: 1. 行业需求旺盛,音视…
-
udp连通性质量压测工具
基于 Rust 的异步运行时 Tokio 开发的一款高性能 UDP 网络压测工具,专注于精准探测两台主机之间的网络状况,为 UDP 应用提供可靠的数据支撑。
-
OpenGL 面试:上下文、线程、指令队列有什么联系?
OpenGL 上下文、线程、指令队列有什么联系? 不是每个线程天然拥有指令队列,而是必须和某个 OpenGL 上下文绑定才行。一个线程在激活一个上下文时,该线程会有对应的 Open…
-
探索 FFmpeg Basics 音视频技术(26): 词汇表 / 关于作者
这个系列文章我们来介绍一位海外工程师如何探索 FFmpeg Basics 音视频技术,对于想要开始学习音视频技术的朋友,这些文章是份不错的入门资料,这是第 26 篇:FFmpeg …
-
NVIDIA AI 发布 Canary-Qwen-2.5B:一款先进的 ASR-LLM 混合模型,在 OpenASR 排行榜上拥有 SoTA 性能
NVIDIA 刚刚发布了Canary-Qwen-2.5B,这是一款突破性的自动语音识别 (ASR) 和语言模型 (LLM) 混合模型,目前以创纪录的 5.63% 的词错率 (WER…
-
使用 AVPlayer 播放 FairPlay DRM 视频的最佳实践
本文介绍使用 AVPlayer 播放 FairPlay DRM 视频的最佳实践。DRM 是指使用加密技术保护视频内容、通过专业技术安全地存储和传输密钥、并允许内容生产商设置商业规则,限制内容观看者的一种系统。
-
英特尔发布衡量游戏图像质量的 AI 工具,为客观量化现代渲染技术的图像质量开辟新途径
英特尔有可能使客观评估现代游戏的图像质量变得更容易。一种新的 AI 驱动的视频质量指标,名为计算机图形视觉质量指标(Computer Graphics Visual Quality…
-
通过预训练的生成音频编码器和声码器实现高效且适应性强的语音增强
语音增强 (SE) 领域的最新进展已经超越了传统的掩码或信号预测方法,转而采用预训练音频模型来获取更丰富、更可迁移的特征。这些模型(例如 WavLM)可以提取有意义的音频嵌入,从而…
-
NVIDIA 发布 Audio Flamingo 3:推动音频通用智能发展的开源模型
听说过通用人工智能 (AGI) 吗?来认识一下它在听觉领域的对手,通用音频智能 (Audio General Intelligence )。NVIDIA 凭借Audio Flami…
-
为什么主流大模型的上下文窗口都是128k?| 深度
上下文工程的前提是大模型充足的上下文窗口,今天主流模型基本都把 128k 作为上下文的标准长度。本文将探讨为什么主流大模型的上下文窗口都是128k?
-
即构科技即时通讯SDK 2.21.0 版本更新,Web\小程序\Flutter\uniapp多端同步发布
2025年7月15日,即构科技即时通讯SDK(ZIM)发布 2.21.0 版本,同步更新 Web、小程序、Flutter 和 uniapp 等多个平台。详细更新功能如下: 新增功能…
-
Rust音视频开发的现状与机遇
Rust 在音视频开发领域的生态正在快速发展,虽然相比 C/C++ 等传统语言的成熟生态仍有差距,但已具备一定的基础和潜力。
-
探索 FFmpeg Basics 音视频技术(24): 网络视频
这个系列文章我们来介绍一位海外工程师如何探索 FFmpeg Basics 音视频技术,对于想要开始学习音视频技术的朋友,这些文章是份不错的入门资料,这是第 24 篇:FFmpeg …
-
Gemini Embedding-001 现已推出:通过 Google API 实现多语言 AI 文本嵌入
Google 的 Gemini Embedding 文本模型 gemini-embedding-001现已通过 Gemini API 和 Google AI Studio…
-
探索 FFmpeg Basics 音视频技术(23): 先进的技术点
这个系列文章我们来介绍一位海外工程师如何探索 FFmpeg Basics 音视频技术,对于想要开始学习音视频技术的朋友,这些文章是份不错的入门资料,这是第 23 篇:FFmpeg …
-
Liquid AI 开源 LFM2:新一代边缘 LLM
随着 Liquid AI 发布其第二代 Liquid Foundation 模型 LFM2,设备端人工智能领域取得了重大飞跃。这一系列全新的生成式 AI 模型代表了边缘计算的范式转…