技术文章
-
大饼 AI 变声怎么样?如何集成大饼 SDK 实现 AI 变声
大饼 AI 变声简介 大饼 AI 变声是市面上一款非常优秀的变声产品,是实时通话中的“柯南变声领结”,完美重现目标角色的音色与韵律,一键变声明星、游戏角色,同时保留用户的语速、情感…
-
如何在 Jitsi Meet 中启用转录功能
本文将介绍如何在 Jitsi Meet 中启用转录功能。 安装和配置 要通过转录安装和配置 Jitsi Meet,请执行以下操作: 1. 根据文档安装 Jitsi Meet。 2….
-
Meta 如何增强 WhatsApp 通话的安全性
隐私和安全是 WhatsApp 的核心。除了通过端到端加密保护个人消息外,WhatsApp 还赋予用户控制自己隐私设置的权力:从您分享的内容、您在网上的显示方式,到谁可以联系您或将…
-
RTMP直播协议深度解析:从保姆级入门到高级优化!
涉及到RTMP直播协议,了解其工作原理和优化技巧对于提升直播质量和用户体验至关重要。在这篇详细剖析的文章中,我们将深入探讨RTMP直播协议的各个方面,以及实际开发中遇到的一些情况,…
-
基于差分隐私的梯度稀疏赋能通信高效联邦学习系统设计与优化 | 南京理工大学李骏等
研究意义 联邦学习(Federated Learning)可在无需共享原始数据的情况下实现分布式客户端协作训练机器学习模型而得到广泛关注。然而,该架构中上传本地模型仍然有泄露客户端…
-
面向平台的智能客服系统之实践演进之路
一、前言 一直以来,面向运营使用的活动平台,在运营使用过程中会偶发出现一些疑难问题,比如运营对某个组件功能的使用有疑问,或者线上的活动表现不符合预期,运营期望产研协助排查。面对这些…
-
2024 年 WebRTC 趋势和预测
本文分享译自 bloggeek博客创始人 Tsahi Levent-Levi。以下是 2024 年的 WebRTC 趋势和预测。它们延续了我们在 2023 年看到的趋势,但也有一些…
-
音频文件格式–celt
CELT介绍 CELT 是一种开放、免版税的有损音频压缩格式,也是一种免费软件编解码器,具有特别低的算法延迟,适用于低延迟音频通信。这些算法是公开记录的,并且可以不受软件专利限制地…
-
WebRTC是什么?WebRTC技术原理详解
WebRTC(Web Real-Time Communication)是一种连接世界的革命性技术,它为通信和直播行业带来了巨大的提升。通过WebRTC,我们能够实现实时的音视频通信…
-
通过贝叶斯隐式表征来压缩数据 | NeurIPS 2023 Spotlight
论文摘要 在数字世界里,很多常见的数据类型都可以看作是一种特殊的连续函数形式,表征为隐式表征。例如,图像可以表征为将每个像素位置映射到对应RGB色值的连续函数。从这个角度出发,我们…
-
通过高斯-拉普拉斯-逻辑混合模型和串联残差模块学习的图像压缩 | TIP 2023
最近,基于深度学习的图像压缩方法取得了显着的成就,并在 PSNR 和 MS-SSIM 指标方面逐渐优于包括最新标准通用视频编码 (VVC) 在内的传统方法。学习图像压缩的两个关键组…
-
完整WebRTC相关协议规范思维导图,WebRTC学习路径
分享来自SIP实验室的《完整WebRTC相关协议规范思维导图》,作者james.zhu。 WebRTC技术发展迅猛,而且基于WebRTC的视频会议应用已经严重威胁到了商业视频会议的…
-
ffmpeg解封装流程
1、av_register_all() av_register_all() 是 FFmpeg 库中的一个函数,它已经在 FFmpeg 4.0 版本中被弃用。这个函数在旧版本的 FF…
-
用大语言模型合成正确的路由配置需要什么?
本文研究了大型语言模型(例如 GPT-4)是否能够在减少人工工作量的情况下合成正确的路由器配置。作者团队发现单独的 GPT-4 表现非常糟糕,它可以生成有一定可行性的粗略配置,但在…
-
IM专题:服务化架构IM系统(2)— 数据迁移
在 IM 服务化架构中,IM 的核心业务(比如:登录、收发消息、状态同步、未读数等等)的实现逻辑与在分层架构 IM 系统中实现逻辑高度类似;本质上,服务化架构就是分层架构,只是在垂…
-
RTMP 在直播场景的应用与动手实践
RTMP(Real Time Messaging Protocol)是一种设计用于实时数据通信的网络协议,主要用于在 Flash/AIR 平台和支持 RTMP 服务器之间流式传输音…
-
CacheGen:语言模型应用程序的快速上下文加载
随着大型语言模型(LLM)开始承担越来越复杂的任务,它们的输入包含更长的上下文来解决需要领域知识或特定于用户的对话历史的问题。然而,使用长上下文对响应式LLM系统提出了挑战,因为在…
-
如何在 React Native 应用中使用 WebRTC 和 WebView
WebRTC 允许 Web 浏览器和移动应用程序之间进行实时通信。以下是如何在 React Native 应用程序中使用 WebRTC 和 WebView 的基本指南: 创建一个 …
-
WebCodecs 开启 Web 音视频新篇章
WebCodecs 是什么 Web 音视频 API 存在什么问题 音视频技术在 Web 平台上的应用非常广泛,已有许多 Web API 间接调用了编解码器来实现特定功能:…
-
什么是 FreeSWITCH API?FreeSWITCH API 如何用于语音
FreeSWITCH 已成为一个功能强大、开源、服务器优化的实时通信应用程序,特别强调语音。它的多功能性和广泛的特性使其成为许多语音通信应用的理想电话平台,从简单的语音呼叫到复杂的…