AI 浏览器正将模型从“回答关于网络的问题”转向“在网络上操作”。在 2025 年,四款 AI 浏览器将定义这一领域:OpenAI 的 ChatGPT Atlas、搭载 Copilot 模式的Microsoft Edge、The Browser Company 的 Dia 以及 Perplexity 的 Comet。它们在自主性、记忆力和隐私保护方面各有不同的设计选择。本文将对比它们的架构、功能及风险特征,帮助不同类型的用户选择最契合其工作流的浏览器。

什么是 AI 浏览器?
AI 浏览器不仅是“网页聊天工具”。它们将浏览器的 DOM(文档对象模型)、标签页图谱和历史记录暴露给 AI 模型,使其能够:
- 阅读并分析多个标签页的内容。
- 保持任务上下文的一致性
- 执行诸如导航、填写表格和完成工作流程等操作
OpenAI ChatGPT Atlas、Microsoft Edge Copilot Mode、The Browser Company 的 Dia 和 Perplexity 的Comet 都能做到这一点,但在自主性、内存和安全性方面各有不同的权衡。
简单对比
- Atlas 具备最全面的智能代理功能:深度集成 ChatGPT,丰富的浏览器控制能力,强大的记忆系统(但隐私机制较为复杂)。
- Copilot 模式是对 Edge 的渐进式重大扩展:统一的 Copilot 系统、跨标签页推理能力、初期的自动化“操作”功能,但相较于 Atlas 和 Comet 仍显保守。
- Dia 是一款基于 Chromium 的 AI 优先浏览器,专为阅读、写作及结构化工作流优化,采用隐私优先默认设置,并刻意限制自主性。
- Comet 是高度智能化的个人助理浏览器,具备深度工作流自动化与本地数据处理能力,当前拥有最激进的法律与安全风险配置。
本文后续部分将以更技术化的方式剖析这些差异。
1. ChatGPT Atlas(OpenAI):具有完整代理模式的 AI 原生浏览器
1.1 架构
Atlas 是一款专用的 AI 浏览器,它基于 ChatGPT 构建,而不是基于带有扩展程序的标准 Chromium 内核。它运行在Chromium内核上,但封装在 OpenAI 的OWL 进程架构中,从而将渲染引擎与 Atlas 应用程序和代理层分离。
主要特点:
- 发布时仅支持 macOS,Windows、iOS 和 Android 版本“即将推出”。
- ChatGPT 随处可见:地址栏、主面板以及可以看到当前页面和标签页的ChatGPT 侧边栏。
这使得 Atlas 拥有了一流的 API:
- 当前选项卡 DOM 和可见内容
- 标签页列表和导航历史记录
- 用户查询和先前的对话状态
1.2 代理模式:真正的浏览器控制
代理模式是其关键区别所在。对于 Plus/Pro/Business 用户,Atlas 可以执行多步骤工作流程:
- 打开和关闭标签页、点击链接、切换网站
- 填写表格和在线申请
- 预订酒店和餐厅等。
- 比较多个网站上的产品并返回结构化摘要
限制条件:
- 代理模式无法访问本地文件或操作系统,也无法下载或执行本地程序。它在浏览器内部的沙盒环境中运行。
- 操作需要用户明确同意;Atlas 会在执行工作流程之前显示“我是否应该开始点击并填写这些表单”之类的提示。
1.3 内存和隐私
Atlas引入了浏览器内存:
- 它存储的是经过筛选的已访问页面摘要和推断出的用户意图,而不是完整的页面抓取结果。摘要保留约 30 天,支持诸如“重新打开我昨天阅读的报告”或“继续雅典行程计划”之类的查询。
- 记忆功能为可选功能,用户可以查看、编辑或删除记忆功能。记忆功能可以全局禁用,也可以在特定网站上禁用。Atlas 支持隐身模式。
OpenAI 还添加了家长控制功能,允许监护人禁用儿童帐户的浏览器内存和代理模式。
关键点:
- Atlas 仍然需要将页面片段和元数据传输到 OpenAI 的服务器进行摘要,这意味着如果保护措施失效,敏感内容可能会泄露。
- 安全研究人员已经演示了利用 Atlas 的地址栏和代理上下文的提示注入攻击,证实了高度代理的浏览会增加攻击面。
1.4 定价和适用性
- macOS 上的 ChatGPT 用户可免费安装Atlas 。
- 代理模式仅适用于付费的 ChatGPT 套餐(Plus、Pro、Business、Enterprise)。
适用性:
- 最适合希望最大限度实现浏览器内自动化,并且能够接受以云为中心的数据处理和不断发展的安全态势的用户。
2. Microsoft Edge 中的 Copilot 模式:具有可控自主性的标签页推理
2.1 架构
Copilot 模式是微软 Edge 浏览器内置的 AI 层,并非独立的浏览器。它提供以下功能:
- 在新标签页上统一显示聊天、搜索和导航的Copilot 框
- 用户选择加入后,即可与Edge 上下文(打开的标签页、历史记录和一些浏览器设置)深度集成。
微软还将 Copilot 模式与以下功能关联起来:
- 旅程:以主题为中心的浏览历史记录集群,Copilot 可以对其进行总结和重新打开。
- Copilot 操作:一个早期代理层,能够执行诸如清除缓存、取消订阅邮件列表和预览预订等操作。
2.2 主动行为
与 Atlas 相比:
- Copilot 模式可以跨多个标签页进行推理、汇总和比较,并协助完成结构化任务,例如旅行计划或多站点研究。
- Actions Preview将其扩展到部分代理流程,例如预订餐厅或填写表格,但目前的评估显示其可靠性不稳定,并且偶尔会出现“幻觉”完成未成功执行的任务的情况。
但 Copilot 模式仍然比 Atlas 或 Comet 模式受到更多限制:
- 它没有公开一个具有自由光标控制的、可公开编程的 DOM 级代理。
- 操作模板的范围更窄、限制更多,尤其适用于电子邮件和帐户敏感操作。
2.3 数据、隐私和企业态势
Edge 的 Copilot 模式显然是面向企业用户的:
- Copilot 对标签页和历史记录数据的访问是明确授权的;用户可以完全禁用基于历史记录的个性化、Copilot 上下文和 Copilot 模式。
- 微软集成了 Prompt Shields 和 Azure AI 安全层,以缓解提示注入和越狱尝试。
适用性:
- 适用于希望实现 AI 辅助浏览和交叉表推理,同时又希望自动化范围可控且比完全智能化的浏览器更易于审计的组织。
3. Dia:AI 优先,基于 Chromium 内核,注重隐私保护
3.1 架构与用户体验
Dia 是 The Browser Company 推出的以 AI 为中心的 Arc 的继任者,它基于Chromium构建,目前仅适用于macOS。
核心设计选择:
- 标准的交互方式是“与标签页聊天”:Dia 的助手可以读取打开的标签页、引用的标签页和选定的内容,并回答问题或就地转换内容。
- Dia 包含一个技能系统,用户可以在其中定义可重用的提示“脚本”和工作流程,用于记笔记或研究模板等任务。
Dia 的用户体验针对以下方面进行了优化:
- 阅读和理解长篇内容
- 页面内写作和编辑
- 学习工作流程(辅导、记忆卡片、论证比较)
3.2 内存和“本地优先”隐私
Dia 的主要区别在于其隐私保护策略:
- 浏览历史记录、聊天记录、书签和已保存的内容均存储在本地并经过加密,只有在需要回答特定查询时才会将数据发送到服务器。
- 记忆功能会存储摘要和学习到的偏好,但用户可以在设置中完全禁用记忆功能,或者控制共享哪些上下文。
最终结果是,AI 浏览器试图表现得更像一个具有范围限定的云调用的本地知识层,而不是一个连续的遥测流。
3.3 代理范围和约束
Dia 的主动性有意低于Atlas 或 Comet:
- 助手可以读取和总结页面、转换文本、生成内容,并对当前标签页集运行技能。
- 当前公开版本没有提供能够跨任意网站进行开放式点击和表单提交的通用 DOM 自动化代理。
实际上,Dia 更像是一个高上下文辅助工具,而非完全自主的网络运营商。这与公司的定位以及 Atlassian 在收购 The Browser Company 后所宣称的目标相符,即强调个体知识工作者的工作流程,而非事务性自动化。
3.4 定价和适用性
- 从 2025 年 10 月起,Dia 将面向所有 Mac 用户开放,无需邀请。
- 免费版:核心 AI 聊天、技能和记忆功能,但有使用限制。
- Dia Pro每月收费20 美元,可在一定使用范围内解锁几乎无限量的 AI 聊天功能。
适用性:
- 非常适合教育和写作密集型工作流程,适合希望使用 AI 增强型浏览功能但又不想让代理全面控制网络会话的用户。
4. Comet:一款具有高度智能化的助手浏览器,但风险较高
4.1 架构和功能
Comet 是 Perplexity 基于Chromium构建的 AI 浏览器,定位为个人 AI 助手和“思考伙伴”,而不是简单的搜索界面。
Comet Assistant可以:
- 总结和探索任何页面
- 执行多步骤工作流程,包括研究、编码、会议准备和电子商务。
- 通过集成连接器管理电子邮件和日历
- 处理复杂的任务,例如比较产品、阅读评论,并一路完成结账。
最近的更新使代理能够工作更长时间,处理更大的任务,强调在多个标签页和时间段内保持持续的、代理行为。
4.2 数据模型和隐私声明
Comet 隐私声明和产品页面声称:
- 浏览数据、cookie 和已保存的凭据默认存储在设备本地。
- 用户可以从 Comet 设置中删除浏览数据和已存储的凭据,并管理 cookie 行为。
- 与1Password 的集成可确保保险库端到端加密,并且对 Perplexity 不透明。
因此,官方架构是混合的:本地浏览器状态,选择性地将上下文上传到 Comet 的服务器和 Perplexity 的搜索模型。
然而,多项独立审查认为,尽管采取了这些控制措施,但以下因素的结合:与第三方服务(Gmail、日历、财务帐户)的深度集成以及代理对这些服务的高度自主权,会产生很大的有效隐私风险范围,尤其是对于企业数据而言。
4.3 安全事件和法律压力
在四家公司中, Comet目前面临的安全和法律问题最为突出:
- 间接提示注入/“ CometJacking”:LayerX 和其他研究人员表明,恶意 URL 和嵌入式提示可以劫持 Comet 助手,从连接的服务中窃取数据,甚至执行欺诈行为。
- 尽管 Perplexity 已经修复了某些特定漏洞,但 Brave、Guardio 和其他公司的安全审计仍然建议对敏感工作负载保持高度谨慎。
- 亚马逊起诉 Perplexity:亚马逊就 Comet 的“代理购物”行为起诉 Perplexity,指控其自动化购物会话访问客户帐户并冒充人类浏览,违反平台规则并损害个性化系统。
4.4 定价和适用性
- 从 2025 年 10 月至 11 月起,Comet 在全球范围内可免费下载;此前仅限 Max 版和 Pro 版的限制已被取消。
- Perplexity 通过Pro / Max订阅(针对更高级别的型号)和Comet Plus(每月约 5 美元)实现盈利,Comet Plus 提供对精选新闻和出版商内容的访问,并捆绑在 Pro / Max 中。
适用性:
- 对于希望在研究、沟通和购买方面实现最大程度自动化,并且乐于在安全和平台策略风险曲线的最前沿操作的用户来说,这款产品非常强大。
对比表
| 方面 | ChatGPT Atlas(OpenAI) | Edge + Copilot(Microsoft) | Dia(The Browser Company) | Comet (Perplexity) |
|---|---|---|---|---|
| 引擎/平台 | 基于 Chium 内核;Atlas shell 采用 OWL 架构;目前支持 macOS,计划支持 Windows 和移动平台。 | Windows 和 macOS 上的 Edge(基于 Chromium 内核)浏览器,可选配 Copilot 模式 | 基于 Chium 内核的 AI 浏览器;仅限 macOS 系统,已正式发布,无需邀请;Windows 版本尚未发布 | 基于 Chium 内核的浏览器,集成 Perplexity 搜索和助手;桌面版全球同步推出,移动版即将上线 |
| 代理自主性 | 高阶模式:代理模式可以在浏览器内进行点击、导航、填写表单、预订以及执行多步骤工作流程。 | 中等:支持交叉表推理和操作;可以执行一些事务步骤,但范围和可靠性有限。 | 低~中等:聊天、技能和记忆力优于标签页;没有可以自由操控任意网站的通用代理;自主性受到有意限制 | 高阶功能:Comet Assistant 可执行跨浏览、电子邮件、日历和电子商务的长时间运行工作流程,包括端到端的购物和计划流程。 |
| 记忆/个性化 | 浏览器内存会将摘要上下文保留约 30 天;跨会话持久化任务上下文,用户可选择启用并控制此功能。 | Copilot 的历史旅程和上下文共享功能需要用户选择加入;个性化设置与 Microsoft 帐户和隐私控制相关。 | 本地加密存储历史记录、聊天记录和书签;Dia Memory 用于个性化设置,并可限制共享内容。 | 本地优先浏览数据加上云端模型;设置允许删除本地数据并调整数据收集。 |
| 最佳适用场景 | 复杂的研究、高度自动化的工作流程以及智能体实验,在这些实验中,高度自主性比风险更重要。 | 在以微软为中心的环境中,利用人工智能摘要和研究辅助功能进行日常浏览。 | 学习、写作和规划,其中隐私和结构化技能比完全自动化更重要。 | 需要一款用于浏览、通讯和购物的个人运营商,并且会主动管理安全和策略风险。 |
2025年该选择哪款 AI 浏览器?
- 如果您想探索浏览器内代理的前沿技术,请选择 Atlas。它提供最丰富的操作界面和内存模型,但代价是安全性和合规性设计更为复杂。
- 如果您需要在浏览器中获得增量式 AI 帮助,并且该浏览器已经符合以 Microsoft 为中心的企业治理,并且您更喜欢有范围的代理而不是无范围的代理,请选择 Edge + Copilot 模式。
- 如果您的主要工作是阅读、学习和写作,并且您希望获得强大的本地优先保证,以及对模型所看到的信息进行明确控制,同时尽量减少自动化,那么请选择 Dia 。
- 只有当你明确希望在浏览器中使用高度自主的个人操作工具,并且愿意密切关注安全公告和平台政策时,可以选择 Comet 。
参考资料:
- https://openai.com/index/introducing-chatgpt-atlas/
- https://www.microsoft.com/en-us/microsoft-copilot/for-individuals/do-more-with-ai/ai-for-daily-life/ai-browser-innovation-with-copilot-in-edge
- https://www.diabrowser.com/skills
- https://www.perplexity.ai/comet/
本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/jishu/63047.html