OpenAI发布Codex Chrome扩展 让AI代理直接操作已登录网站
•40 阅读•4分钟•应用
OpenAIAgentCodexChrome
•40 阅读•4分钟•应用
背景
自OpenAI推出“Computer Use”概念后,Codex已能够在内置浏览器或专属插件中完成部分网页任务。然而,真实业务场景往往需要使用用户已登录的浏览器状态,例如读取企业内部系统或社交平台信息。为解决这一痛点,OpenAI于2026年5月发布了Codex Chrome扩展,首次让AI代理能够在用户的Chrome会话中直接执行操作。
功能亮点
- 登录态访问:Codex可利用用户已登录的Chrome账号访问LinkedIn、Salesforce、Gmail等受限网站,无需额外OAuth集成。
- 多层工具链:任务自动在三层工具之间切换:① 插件(已有专属集成)② Chrome(需要登录态)③ 内置浏览器(本地主机)。用户亦可通过
@Chrome语法强制调用Chrome。 - 标签页组管理:扩展在Chrome中创建独立的标签页组,确保AI操作不干扰用户当前浏览会话。
- DevTools 并行:在执行网页任务时,Codex还能调用Chrome DevTools,实现调试、网络抓包等高级操作。
- 安全确认:每当Codex首次访问新域名时,会弹出确认对话框,用户可将域名加入白名单或黑名单,降低恶意站点注入风险。
安装与使用指南
- 获取扩展:前往Chrome Web Store搜索 “Codex by OpenAI”,点击 “Add to Chrome”。
- 在Codex客户端激活:打开Codex桌面应用 → Plugins → Chrome → Add,按照提示完成连接流程。
- 授权权限:扩展请求读取所有页面数据、浏览历史、标签组等权限,确认后状态栏显示 “Connected”。
- 发起任务:在Codex对话框中直接使用
@Chrome触发,例如@Chrome 打开 Salesforce 并更新客户信息,或自然描述任务,系统会自动选用Chrome。 - 审查与批准:首次访问新站点时会弹出 “Allow this site?” 对话框,用户可永久允许、一次性允许或拒绝。
“我们希望通过Chrome扩展,让Codex在真实工作环境中更自然地协同人类。” — OpenAI 官方博客
安全与隐私考量
- 权限范围:扩展需要访问浏览历史、书签、页面内容等全局权限,以实现跨标签页信息收集。
- 防止 Prompt Injection:OpenAI提醒开发者审查网页内容,防止恶意页面通过隐藏指令劫持Codex的行为。
- 记忆功能:开启 Memories 时,Codex会保留跨会话的浏览上下文;如需隔离,可在设置中关闭,以避免历史数据泄露。
- 数据存储:除用户显式共享的截图或文本摘要外,OpenAI不主动保存浏览活动。
市场意义
Codex Chrome扩展将AI代理的使用场景从“沙箱”迁移到真实登录环境,显著提升了企业级自动化、客服助理以及个人生产力工具的实用性。对比传统RPA方案,Codex无需额外脚本编写或页面元素定位,利用自然语言即可完成复杂的跨系统操作。随着企业对生成式AI的需求持续增长,此类深度浏览器集成有望成为下一代工作流的标准接口。
后续关注:OpenAI计划在未来几个月推出对Edge、Brave等Chromium分支的支持,并进一步细化企业级权限管理。
本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。