技术文章
-
《Agentic Design Patterns:构建智能系统的实战指南》- 第一章 提示链
书籍名称:Agentic Design Patterns: A Hands-On Guide to Building Intelligent Systems本书作者:Antonio…
-
WebRTC 实时通信解析
WebRTC(Web实时通信)是一套开放的实时通信标准,能够在浏览器和移动应用中实现点对点(P2P)的音频、视频和数据传输,无需安装插件或第三方软件。 1、WebRTC概述 Web…
-
《Agentic Design Patterns:构建智能系统的实战指南》- 前言
本文是对《智能体设计模式》一书前言部分的翻译,此章节介绍了本书的目录、引言等内容。
-
Flutter如何实现即时通讯功能(Flutter接入IM SDK示例)
Flutter是一个跨平台的移动应用开发框架,本教程适用于开发以下平台的应用:iOS、Android、macOS、Windows、Web。下面介绍如何在Flutter接入中接入 Z…
-
为何 WebRTC 是实时语音 AI 架构的最佳传输方案
语音 AI 应用需要实时可靠的音频通信,才能实现与 AI 客服机器人、虚拟助手、交互式语音应答平台及其他语音系统之间的自然对话。选择合适的传输协议至关重要,错误的协议可能导致音频卡…
-
告别 Linux 音频困扰:PipeWire 如何让一切变得简单
Linux 音频系统出了名的混乱,往好了说是令人困惑,往坏了说是彻底崩溃。面对 PulseAudio、ALSA和 JACK 这三种音频框架,用户往往只能通过反复试错和大量调试来获得…
-
AI 视频生成器详解:Sora, Grok 等平台背后的技术
你是否曾好奇,为何有些人只需点击几下,就能用文字、图片甚至简单提示生成流畅的视频? 这正是 AI 视频生成器的用武之地。从学生到内容创作者,这些工具让任何人都能将创意转化为视频,无…
-
谷歌推出语音到检索(S2R)技术,无需先将语音转为文本即可检索信息
谷歌人工智能研究团队通过引入语音转检索(S2R)技术,实现了语音搜索的重大突破。该技术将语音查询直接映射为嵌入向量,无需先将语音转为文本即可检索信息。谷歌团队将S2R定位为架构与理…
-
libpeer:适用于物联网/嵌入式设备的便携式 WebRTC 库
libpeer是一个用C语言编写的WebRTC实现,基于BSD socket开发。该库旨在将物联网/嵌入式设备的视频/音频流与WebRTC集成,例如ESP32和树莓派。 然后在用户…
-
ZEGO AI 数字人伴学互动方案
ZEGO AI 数字人伴学互动方案,通过 AI Agent + 数字人 + RTC 三位一体的技术架构,用AI 数字人教师代替真人老师,实现学生个性化的口语互动,并给出个性化的反馈,提升学习效果。
-
EMQX 6.0 新特性:融合 MQTT 与消息队列,开启消息传输新纪元
EMQX 6.0 是继 5.x 系列之后,首个具有里程碑意义的重大更新。该版本首次将 MQTT 消息通信与消息队列能力结合,重新定义了物联网数据流处理。这一里程碑版本引入…
-
Jitsi Meet 推出 Receiver Audio 订阅服务
Jitsi Meet 长期支持视频 ReceiverConstraints 功能。接收方可指定希望接收的视频流及其分辨率,后端将在可用带宽范围内尽力满足这些约束。但音频方面此前缺乏…
-
构建和运行 WebRTC 应用程序到底需要多少钱?
本文将剖析构建 WebRTC 基础设施及运行生产级 WebRTC 应用的实际成本。我们将通过详细计算对比三种承载相同工作负载的方案,助您确定最适合自身场景的实施路径。
-
OpenVidu Meet:一款基于 OpenVidu 构建的虚拟会议自托管解决方案
OpenVidu Meet 是一款基于 OpenVidu 构建的完整视频通话服务,旨在为虚拟会议提供易于使用的自主托管解决方案。
-
如何通过更智能的 SD-WAN 策略提升 UCaaS 质量
混合办公与远程工作重新定义了现代职场。如今团队成员可从总部、分支机构、家庭网络、咖啡馆乃至旅途中协同工作,过程中常需在Wi-Fi、宽带、5G或卫星网络间切换。面对如此复杂的网络环境…
-
探索 Vulkan 音视频技术(11):平台特定实现
在开发跨平台 Vulkan 应用程序时,处理平台特定差异对于确保代码在不同操作系统上无缝运行至关重要。SaschaWillems/Vulkan 仓库展示了一种优雅的平台抽象方法,使相同的 Vulkan 示例能够在不同平台上运行。
-
探索 Vulkan 音视频技术(10):GLSL着色器指南
着色器是任何 Vulkan 应用程序的核心,定义了图形和计算操作如何在 GPU 上执行。本文将带你了解着色器结构、编译工作流以及整个示例中使用的集成模式。
-
AnimeColor:基于DiT的动漫视频上色 | ACM MM 2025
动画上色是动画制作中的关键环节,然而现有动画线稿着色模型在保持颜色一致性和稳定性方面仍存在一定挑战。基于此我们提出了一种新颖的线稿视频动画上色模型-ColorAnime。Color…
-
探索 Vulkan 音视频技术(9):性能优化示例
性能优化对于创建能够充分利用现代 GPU 硬件的高性能 Vulkan 应用程序至关重要。本文将探讨SaschaWillems/Vulkan 仓库中可用的关键性能优化示例,并解释如何在自己的应用程序中利用这些技术。
-
如何在 Ubuntu 25.04 中为 Android 构建 WebRTC
Google 曾提供 libWebRTC 库的预编译 Android 镜像,事实上,其官方文档至今仍推荐这种使用方式。但自 WebRTC M80 版本(2020年1月)起,他们决定…