Google发布Gemini 3 Deep Think升级,科学推理性能突破新纪录
•33 阅读•3分钟•前沿
Google生成式AIGeminiDeep Think
•33 阅读•3分钟•前沿

升级概述
Google DeepMind 今日正式发布 Gemini 3 Deep Think 的全新版本。该模式在原有深度科学知识库的基础上,加入了更细粒度的数学推理、实验设计和工程建模能力。升级后,Deep Think 已在 Gemini App 中对 Google AI Ultra 订阅者开放,并首次向科研机构、企业工程团队提供早期 API 接入渠道。
关键性能突破
- Humanity’s Last Exam:成绩提升至 48.4%(不使用外部工具),刷新前代模型记录。
- ARC‑AGI‑2:取得 84.6% 的通过率,获 ARC Prize Foundation 官方认证。
- Codeforces:Elo 达到 3455,位列竞赛编程基准最高。
- IMO 2025:金牌水平成绩,证明在高等数学推理上的接近人类专家表现。
- International Physics & Chemistry Olympiads 2025:在笔试部分均实现金牌级别,展示跨学科科学推理的广度。
"Deep Think 已经能够在缺乏明确答案、数据噪声大的科研场景中提供可靠的分析建议,这在过去只能依赖人类专家的直觉。" – Google DeepMind 研发团队
实际案例
- Rutgers 大学数学家 Lisa Carbone:利用 Deep Think 审阅高能物理领域的数学论文,成功捕捉到一处同行评审未发现的逻辑漏洞。
- Duke 大学 Wang 实验室:在复杂晶体生长工艺中,Deep Think 设计出厚度超过 100 µm 的薄膜配方,显著提升材料发现效率。
- Google Platforms 与 Devices 项目负责人 Anupam Pathak:借助 Deep Think 加速物理部件的结构设计,将概念草图直接转化为可 3D 打印的模型文件。
早期接入与生态布局
Google 为 AI Ultra 订阅者在 Gemini App 中提供即点即用的 Deep Think 界面;同时启动 Early Access Program,邀请科研机构、企业工程团队通过 Gemini API 进行定制化测试。感兴趣的用户可在官方页面提交申请,Google 将根据使用场景提供技术支持与资源配额。
行业意义
此次升级标志着大模型在「科学推理」这一高价值垂直领域的实用化迈出关键一步。与传统的生成式模型侧重文本生成不同,Deep Think 通过结合严谨的数学、物理与化学知识库,实现了从抽象理论到工程落地的闭环。未来,随着 API 的逐步开放,更多科研团队和工业研发部门将能够在无需自行训练大模型的前提下,直接调用高阶推理能力,加速新材料发现、复杂系统建模以及跨学科创新。
"我们期待 Deep Think 能成为科研工作者的第二大脑,让 AI 真正参与到前沿科学探索中。" – Sundar Pichai, Google CEO
本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。