技术文章
-
Moonshot AI 推出 Muon 和 Moonlight:利用高效训练技术优化大规模语言模型
优化大规模语言模型需要先进的训练技术,以降低计算成本并保持高性能。优化算法对于确定训练效率至关重要,尤其是在具有大量参数的大型模型中。虽然像 AdamW 这样的优化器已被广泛采用,…
-
3D 视频会议的未来一瞥
在最近举行的欧洲集成系统会议上,思科展示了其空间 Webex 会议解决方案,该方案利用了苹果 Vision Pro 护目镜。人们普遍猜测,下一代苹果护目镜将更加便宜。谷歌展示了其创…
-
关于FreeSWITCH的状态机工作机制和运行优化建议讨论
没有状态机,就无法控制状态。这是废话,但是是核心。就像人脱离了大脑控制,AI脱离了算法控制一样,多多少少会出现幻觉。对于一个靠会话来控制系统运行的软件环境来说,没有状态机就无法正常…
-
VoIP DDoS:VoIP 网络安全策略
全面了解 VoIP 中的 DDoS 攻击是什么,以及如何通过成熟的策略和主动防御保护您的企业 VoIP 网络免受 DDoS 攻击,确保业务通信不中断。 想象一下,当您最需要 VoI…
-
使用 Scoket.io、React、NestJS 和 Redis Cluster 构建可扩展的实时聊天应用程序
本文将引导您使用现代技术构建一个可扩展的实时聊天应用程序。我们将重点讨论如何创建一个既能处理数千个并发用户,又能保持实时性能的系统。 架构概述 聊天应用程序采用可扩展架构,包含以下…
-
Meta 工程师分享 AV1 集成到 Android 生态系统的问题,挑战和解决方案
大型内容所有者采用 AV1 编解码器的过程漫长而复杂,Meta 高级媒体软件工程师 David Ronca(曾在 Netflix 开发编码解决方案长达 12 年)对此深有体会。在与…
-
人工智能正在快速实现音频内容的自动化生成
人工智能正在进一步涉足音频内容生成领域,并极大地改变了其发展。谷歌、Meta 和微软等知名供应商以及 Revoicer 和 WellSaid 等初创公司正在利用生成式人工智能,提供…
-
音视频消费侧各组件框架
本文分享音视频消费侧各组件框架,包括播放组件层、播放内核层和底层能力层。另分析音视频下载、音视频解封装、音视频解码和音视频渲染等模块内容。
-
构建法律 AI 聊天机器人:使用 bigscience/T0pp LLM、开源 NLP 模型、Streamlit、PyTorch 和 Hugging Face Transformers 的分步指南
在本教程中,我们将使用开源工具构建一个高效的法律 AI 聊天机器人。它提供了使用bigscience/T0pp LLM、Hugging Face Transformers 和 Py…
-
FreeSWITCH 中 mod_limit 的作用讨论
limit到底是干什么的?如何一个稳定的系统需要多种极限的设计来保证系统的稳定运行。下面,我们来讨论一个FreeSWITCH环境下大家不经常关注,但是必须注意机制设置模块limit…
-
用meson加速Windows系统FFmpeg构建
如果因各种原因只能用Windows的,比如做Windows的硬件解码和播放,meson构建ffmpeg不失为一个提升开发效率的选择。
-
直播推流组件架构、重点需求技术方案和常见问题解析
本文分享来自公众号——关键帧Keyframe的分享。 本文中,我们来介绍在实际工作中,我们实现的直播推流组件架构、重点需求技术方案和常见问题解析。 其中,重点需求技术方案包括: 1…
-
Google DeepMind 发布 PaliGemma 2 Mix:针对多种视觉语言任务进行微调的新型指令视觉语言模型
视觉语言模型 (VLM) 长期以来一直有望弥合图像理解和自然语言处理之间的差距。然而,实际挑战依然存在。传统的 VLM 通常会在图像分辨率的变化、上下文细微差别以及将视觉数据转换为…
-
FreeSWITCH环境中核心模块mod_dptools 的工作机制,配置和优化讨论分析
FreeSWITCH环境中,有很多模块是经常使用的重要模块,需要开发人员深入掌握这些模块。 mod_dptools 模块就是主要模块之一。我们针对此模块做更多解释,希望帮助读者对业…
-
FreeSWITCH企业电话系统典型远程注册NAT场景架构分析与优化建议
NAT问题是非常常见的企业电话系统中远程用户使用问题。在FreeSWITCH环境中,很多用户基本上没有SBC的边界控制能力,只能手搓,使用默认环境来配置。但是,配置后,随着用户数量…
-
直播间互动框架性能优化与稳定性实践
导读:直播间互动体验框架技术实践,揭秘性能与稳定性优化之道,快来探索吧!在百度直播间歌会红包等活动中,我们创新性地将红包互动与高质内容深度融合,通过技术架构升级与系统性优化,打造了…
-
DFSQ:用于超分辨率网络的分布灵活的子集量化方法 | 厦门大学纪荣嵘团队
研究意义 图像超分辨率(SR)技术旨在从低分辨率图像中恢复高分辨率图像,广泛应用于医学影像、视频增强和卫星图像处理等领域。然而,现有的SR模型通常依赖庞大的网络规模和计算资源,难以…
-
One-D-Piece:图像Tokenizer满足质量可控压缩
当前的图像标记化方法需要大量标记来捕获图像中包含的信息。尽管图像的信息量不同,但大多数图像分词器仅支持固定长度的分词化,导致分词分配效率低下。在本研究中,本文介绍了 One-D-P…
-
增强扩散模型:稀疏性和正则化在高效生成 AI 中的作用
扩散模型已成为一个重要的生成式 AI 框架,在图像合成、视频生成、文本到图像转换和分子设计等任务中表现出色。这些模型通过两个随机过程发挥作用:一个是逐渐向数据添加噪声并将其转换为高…
-
基于流媒体点直播业务的算法赋能探索
本文从B站流媒体点直播的日常业务出发,结合具体业务实例详细介绍如何利用算法赋能业务。 作者丨Fiver来源 | 多媒体 哔哩哔哩技术 背景概述 早在20世纪人们就开始了人工智能的相…