OpenAI发布Codex Chrome扩展 让AI代理直接操作已登录网站

40 阅读4分钟应用

背景

自OpenAI推出“Computer Use”概念后,Codex已能够在内置浏览器或专属插件中完成部分网页任务。然而,真实业务场景往往需要使用用户已登录的浏览器状态,例如读取企业内部系统或社交平台信息。为解决这一痛点,OpenAI于2026年5月发布了Codex Chrome扩展,首次让AI代理能够在用户的Chrome会话中直接执行操作。

功能亮点

  • 登录态访问:Codex可利用用户已登录的Chrome账号访问LinkedIn、Salesforce、Gmail等受限网站,无需额外OAuth集成。
  • 多层工具链:任务自动在三层工具之间切换:① 插件(已有专属集成)② Chrome(需要登录态)③ 内置浏览器(本地主机)。用户亦可通过 @Chrome 语法强制调用Chrome。
  • 标签页组管理:扩展在Chrome中创建独立的标签页组,确保AI操作不干扰用户当前浏览会话。
  • DevTools 并行:在执行网页任务时,Codex还能调用Chrome DevTools,实现调试、网络抓包等高级操作。
  • 安全确认:每当Codex首次访问新域名时,会弹出确认对话框,用户可将域名加入白名单或黑名单,降低恶意站点注入风险。

安装与使用指南

  1. 获取扩展:前往Chrome Web Store搜索 “Codex by OpenAI”,点击 “Add to Chrome”。
  2. 在Codex客户端激活:打开Codex桌面应用 → Plugins → Chrome → Add,按照提示完成连接流程。
  3. 授权权限:扩展请求读取所有页面数据、浏览历史、标签组等权限,确认后状态栏显示 “Connected”。
  4. 发起任务:在Codex对话框中直接使用 @Chrome 触发,例如 @Chrome 打开 Salesforce 并更新客户信息,或自然描述任务,系统会自动选用Chrome。
  5. 审查与批准:首次访问新站点时会弹出 “Allow this site?” 对话框,用户可永久允许、一次性允许或拒绝。

“我们希望通过Chrome扩展,让Codex在真实工作环境中更自然地协同人类。” — OpenAI 官方博客

安全与隐私考量

  • 权限范围:扩展需要访问浏览历史、书签、页面内容等全局权限,以实现跨标签页信息收集。
  • 防止 Prompt Injection:OpenAI提醒开发者审查网页内容,防止恶意页面通过隐藏指令劫持Codex的行为。
  • 记忆功能:开启 Memories 时,Codex会保留跨会话的浏览上下文;如需隔离,可在设置中关闭,以避免历史数据泄露。
  • 数据存储:除用户显式共享的截图或文本摘要外,OpenAI不主动保存浏览活动。

市场意义

Codex Chrome扩展将AI代理的使用场景从“沙箱”迁移到真实登录环境,显著提升了企业级自动化、客服助理以及个人生产力工具的实用性。对比传统RPA方案,Codex无需额外脚本编写或页面元素定位,利用自然语言即可完成复杂的跨系统操作。随着企业对生成式AI的需求持续增长,此类深度浏览器集成有望成为下一代工作流的标准接口。


后续关注:OpenAI计划在未来几个月推出对Edge、Brave等Chromium分支的支持,并进一步细化企业级权限管理。

本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。