Google DeepMind发布Gemini Deep Think 助力数学与科学研究实现突破

背景与核心突破

Google DeepMind近日公布了全新科研助理模型 Gemini Deep Think，旨在通过大规模语言模型的推理能力，直接参与数学、物理和计算机科学的前沿研究。模型以 Gemini 系列为底座，加入了专用的Aletheia数学研究代理和多模态推理管线，实现了从文献检索、解题生成到结果验证的全链路自动化。

数学研究的里程碑

IMO 金牌水平：2025年夏季，Deep Think 在国际数学奥林匹克（IMO）模拟赛中达到金牌标准，随后在2026年1月的内部 IMO‑ProofBench Advanced 基准上取得 90% 以上正确率。
自主论文生成：模型在无人工干预的情况下完成了《算术几何结构常数的计算》论文（Feng26），并在 Erdős‑1051 公开数据库中自行提出并证明了四个未解问题。
人机协作案例：在《交互粒子系统的上界》研究中，Deep Think 与人类专家共同完成了定理证明（LeeSeo26），展示了“AI‑引导协作”模式的可行性。

计算机科学与物理的跨界应用

算法难题突破：通过将连续数学工具（Kirszbraun 定理、Stone‑Weierstrass 定理）迁移至离散优化，模型成功解决了长期卡住的 Max‑Cut 与 Steiner Tree 问题。
子模优化猜想反证：针对 2015 年提出的在线子模优化猜想，Deep Think 构造了三元组合反例，正式否定了该直觉。
宇宙弦引力辐射：在物理分支，模型利用 Gegenbauer 多项式对奇点积分进行闭式求解，提供了宇宙弦辐射的解析表达。

人机协作的全新范式

DeepMind 将 Gemini Deep Think 定位为“智力倍增器”。模型通过自然语言验证器实时检测解答缺陷，能够主动承认失败并迭代改进；同时结合 Google Search 与网页浏览，实现文献的精准引用，避免了常见的幻觉与错误引用。

未来展望

报告指出，随着推理算力的进一步提升，Gemini Deep Think 在 PhD 级别的科研任务上将保持 降低推理算力 的同时提升推理质量。团队计划将该技术推广至生物医药、材料科学等更广泛的实验室工作流，构建跨学科的 AI 研究生态。

"AI 正在从工具转向伙伴，帮助科研人员专注于创新思考而非繁琐验证。" — DeepMind 项目负责人 Thang Luong

Gemini Deep Think 的发布标志着生成式 AI 在科研领域的首次系统化落地，预计将在未来数年内重塑学术出版、实验设计以及跨学科合作的格局。

Google DeepMind发布Gemini Deep Think 助力数学与科学研究实现突破