OpenAI
-
OpenAI 的 AgentKit 打造客户体验护城河
在 OpenAI 最近的开发者日上,发生了一件有趣的事。OpenAI 通过发布 AgentKit 工具包,实现了技术栈的升级,从“基础模型供应商”转型为智能体工具链提供商。该工具包…
-
OpenAI 计划推出 AI 生成视频的类似 TikTok 的社交应用
OpenAI 正在开发一款专注于分享 AI 生成的视频内容的社交媒体应用程序。该应用程序将利用 OpenAI 的 Sora 视频生成工具,使用户能够创建合成视频。
-
OpenAI 发布了 GPT-5:最智能、最快、最实用的 OpenAI 模型
OpenAI 刚刚发布了GPT-5,标志着生成式 AI 的重大飞跃,引入了可同时处理通用任务和高度专业化任务的高级功能。本文将深入探讨 GPT-5 的架构、新功能、性能改进以及其对…
-
OpenAI 发布开放权重 LLM:gpt-oss-120B(可在电脑上运行)和 gpt-oss-20B(可在手机上运行)
OpenAI 刚刚在 AI 领域掀起了一股震撼:自 2019 年 GPT-2 发布以来,该公司首次发布了不止一个,而是两个开放权重语言模型:GPT-OSS-120b 和 GPT-O…
-
OpenAI 的 o3 和 o4-mini 模型如何改变视觉分析和编码
2025年4月,OpenAI 推出了迄今为止最先进的模型 o3 和 o4-mini 。这些模型代表了人工智能(AI)领域的重大进步,提供了视觉分析和编码支持方面的全新能力。凭借强大…
-
OpenAI 宣布与 Shopify 建立合作伙伴关系,并推出 ChatGPT 购物功能
OpenAI 昨日宣布,ChatGPT 允许用户直接从搜索结果中购物。 这一消息传出之际,通过 ChatGPT 进行搜索正变得越来越流行,仅上周的搜索量就超过 10 亿次。 现在,…
-
测量 OpenAI 基于 WebRTC 的实时 API 的响应延迟
从 Chrome 浏览器中提取的原始 RTP 数据包来测量总延迟,本文分析了这种方法在 OpenAI 的 WebRTC 实时 API 中的应用,并分析了结果。
-
OpenAI 将 Sora 视频生成器引入英国和欧盟
OpenAI 从今天开始向英国和欧洲的用户推出其 Sora 视频生成系统。ChatGPT Pro 和 Plus 用户现在无需额外付费即可使用该工具,但会受到一些使用限制。 尽管So…
-
推进对话式 AI:OpenAI 为 Claude 提供全新双向语音模式
最近的报告显示,OpenAI 正在为其 AI 模型 Claude 开发新功能,包括突破性的“双向”语音模式。这一进步代表了对话式 AI 技术的重大飞跃,旨在使与 AI 系统的交互更…
-
OpenAI Sora 与 AWS Nova 的区别:哪个更适合视频创作?
最近,OpenAI 的 Sora 和亚马逊(AWS)的 Nova 在 Bedrock 平台上发布,标志着 AI 领域翻开了激动人心的新篇章。虽然这两种模式都以各自的方式推动着这一领…
-
OpenAI 在实时图像和虚拟世界创建方面的突破
探讨 OpenAI 在实时图像和虚拟世界的突破对各行各业的专业人士意味着什么、带来了哪些机遇,以及随着这些功能的发展,未来可能会是什么样子。
-
OpenAI 开始将 WebRTC 用于自己的语音机器人
在5月13日公布的信息中,OpenAI 正在部署一些特别的功能,可以使得ChatGPT进行类似电话通话能力。 OpenAI已经部署了必要的 WebRTC 服务器来实现这一功能。最初…
-
OpenAI 警告企业逐步淘汰基于语音的身份验证,并停止发布其语音克隆工具
OpenAI 已对各公司发出红色警报,警告他们在开发语音引擎解决方案的过程中,是时候放弃语音身份验证了。 语音引擎是一种语音克隆工具,可以生成“非常类似于”原始说话者的自然语音。 …
-
OpenAI 发布语音引擎“Voice Engine”来创建人类声音
OpenAI 现在可以利用其 “语音引擎 “(Voice Engine)平台重现人类的声音。由于明显的道德和法律问题,这家由微软投资的公司对新的人工智能引擎…
-
Sora引领的AI生成视频时代,如何应对背后的内容风险挑战?
在推出ChatGPT一年多后,OpenAI近日发布文生视频大模型Sora,成为龙年科技界的“第一把火”,并以惊人的速度持续发热,再次引发全球瞩目。Sora可根据用户输入的指令,生成…
-
解读OpenAI Sora文生视频技术原理
以下文章来源于清熙 ,作者王庆法。 OpenAI Sora文生视频(图像看作单帧视频)一放出就炸翻整个AI 圈,也是ChatGPT掀起GenAI热潮时隔一年后,OpenAI再次史诗…
-
Sora: 作为世界模拟器的视频生成模型
OpenAI新提出了一种功能强大的视频生成大模型,采用tansformer结构处理视频图像的时空块,支持不同长度、不同分辨率和不同长宽比的视频生成。其中最大的Sora模型支持长达一…
-
MetaAI发布语音识别错误率是OpenAI的Whisper模型的一半且支持1107种语言的语音模型:MMS
今天,Meta的首席AI科学家Yann LeCun在推特上宣布了MetaAI的最新研究成果:MMS,一个支持1107种语言的自动语音识别模型和语音合成模型,该模型自动语音识别的单词…
-
微软GitHub引入OpenAI聊天功能,允许开发人员询问如何编码
北京时间3月22日晚间消息,据报道,微软(272.29, -1.49, -0.54%)旗下软件开发平台GitHub今日发布了新版编程工具“Copilot X”,…
-
比较 OpenAI 的 CodeX 和 ChatGPT
随着 AI 平台研究和开发的进步,数据解释和分析的自动化程度提高将变得司空见惯——从而带来更高效的流程和应用程序。OpenAI 是人工智能领域的先驱,开发了CodeX 和ChatG…