Meta
-
Meta 如何在 Facebook 上部署 AV1:从 Reels 到 Stories 再到 Messenger
近年来,随着 Reels 和 Stories 功能的普及,视频内容在 Facebook 平台占据了核心地位。Meta 技术项目经理 Hassene Tmar 在与流媒体学习中心创始…
-
Meta AI开源感知编码器视听(PE-AV):为SAM音频和多模态检索提供支持的视听编码器
Meta 研究人员推出了感知编码器视听模型(PE-AV),作为用于联合音频和视频理解的新型编码器系列。该模型利用对约 1 亿个带有文本字幕的音视频对进行大规模对比训练,在单一嵌入空…
-
Meta AI 眼镜新增 Spotify 集成和语音增强功能
近日,Meta 公司宣布为其 Ray-Ban 及 Oakley 智能眼镜推出 v21 软件更新。这次更新引入了对话增强技术和 AI 驱动的音乐匹配功能,可根据用户的视线做出反应——…
-
Meta通过压缩元数据在Instagram上启用杜比视界HDR功能
通过与 FFmpeg 开发人员的技术合作以及 Dolby 规范,Instagram iOS 成为 Meta 首个支持 Dolby Vision 视频播放的应用。
-
Meta:大规模视频隐形水印技术
本文将分享 Meta 如何克服隐形水印技术扩展过程中的挑战,包括如何构建基于CPU的解决方案,该方案不仅能提供与 GPU 相当的性能,更具备更优的运行效率。
-
Meta 禁止 ChatGPT 和 Perplexity 等通用 AI 聊天机器人进入 WhatsApp Business API
Meta 宣布了一项颠覆性的政策,禁止 ChatGPT 和 Perplexity 等通用 AI 聊天机器人进入 WhatsApp Business API,该政策将于 2026 年…
-
Meta 收购 A16z 支持的 AI 初创公司 WaveForms
Meta 收购了 WaveForms AI,这是一家专注于识别和复制音频情感的人工智能的初创公司。 WaveForms AI 由曾在 Meta 和 OpenAI 从事音频研究的 A…
-
Meta 的 “Codec Avatars” 原型现在支持更换发型
Meta 的逼真 “Codec Avatars ”原型现在支持更换发型,头部和头发分别建模。 近十年来,Meta 公司一直在研究和开发一项名为 Codec Avatars 的技术,…
-
Meta 通过视频、语音和虚拟试穿扩展 Advantage+ AI 广告工具
Meta最近携一系列面向广告主的全新生成式 AI升级版亮相戛纳国际创意节。该公司正在扩展其 Advantage+ 广告创意套件,提供旨在加快内容创作速度且不牺牲品牌一致性的工具。这…
-
Meta 发布 J-VEPA 2 AI 模型,可通过视频了解世界
Meta Platforms Inc. 的人工智能研究部门今天发布了一种新的人工智能模型,该模型可以通过类似人类理解世界的方式解释视频信息,提高机器人和人工智能代理对物理世界的训练…
-
Instagram DM 中引入音频和群组新功能
Instagram DM 中推出了一系列与音频消息和群组相关的新功能。通过这种方式,Meta 旗下的社交网络继续加强对用户连接的关注,从而实现其 2025 年的目标。 鼓励互动的更…
-
雷朋 Meta AI 升级:“Hey Meta”语音提示及其他功能现已通过最新更新推出
多年来,Meta一直致力于通过新功能使其 Ray-Bans 智能眼镜变得更加智能,但在其最新更新中,该公司赋予了其根据用户需求调用 Meta AI 的能力。 用户现在可以通过简单地…
-
Meta AI 发布 Web-SSL:一种可扩展且无需语言的视觉表征学习方法
近年来,诸如 CLIP 之类的对比语言-图像模型已成为学习视觉表征的默认选择,尤其是在视觉问答 (VQA) 和文档理解等多模态应用中。这些模型利用大规模图像-文本对,通过语言监督来…
-
Meta AI 推出感知编码器:一款大规模视觉编码器,在图像和视频的多项视觉任务中表现出色
设计通用视觉编码器的挑战 随着人工智能系统日益多模态化,视觉感知模型的作用也愈发复杂。视觉编码器不仅需要识别物体和场景,还需要支持诸如字幕制作、问答、细粒度识别、文档解析以及跨图像…
-
Meta AI 的 MILS:改变零样本多模态 AI 的游戏规则
多年来,人工智能 (AI)取得了令人瞩目的发展,但它始终存在一个根本性的限制,即无法像人类一样处理不同类型的数据。大多数 AI 模型都是单峰的,这意味着它们只专注于一种格式,如文本…
-
Meta 推出适用于 Facebook 和 Instagram 的客户服务 AI 代理,面向中小企业提供免费试用
Meta 公司开发了一种新的机器人(或称 “Business AI”),支持中小企业(SMB)提供客户服务。 作为免费试点项目的一部分,该人工智能代理将很快在 Facebook、I…
-
Meta AI 推出 CoCoMix:将标记预测与连续概念相结合的预训练框架
大型语言模型 (LLM) 预训练的主要方法依赖于下一个标记预测,这种方法已被证明可以有效捕捉语言模式。然而,这种方法也有明显的局限性。语言标记通常传达的是表层信息,需要模型处理大量…
-
Meta AI 推出 MILS:一种无需训练的多模态 AI 框架,用于零样本图像、视频和音频理解
大型语言模型 (LLM) 主要用于基于文本的任务,这限制了它们解释和生成多模态内容(例如图像、视频和音频)的能力。传统上,多模态操作是针对大量标记数据进行训练的任务特定模型,这使得…
-
Meta AI 推出 CLUE:旨在解决传统图像安全系统缺陷的 AI 框架
数字平台的快速发展使图像安全问题成为关注焦点。从露骨的内容到暴力的描述,有害图像给内容审核带来了巨大挑战。人工智能生成内容(AIGC)的激增加剧了这些挑战,因为先进的图像生成模型可…
-
Meta AI 发布 Apollo:用于视频理解的全新 Video-LMM 大型多模态模型系列
虽然多模态模型 (LMM) 在文本和图像任务方面取得了显著进展,但基于视频的模型仍然不够完善。视频本质上很复杂,结合了空间和时间维度,需要更多的计算资源。现有方法通常直接采用基于图…