Google DeepMind发布Gemini Deep Think 助力数学与科学研究实现突破

26 阅读3分钟前沿
Google DeepMind发布Gemini Deep Think 助力数学与科学研究实现突破

背景与核心突破

Google DeepMind近日公布了全新科研助理模型 Gemini Deep Think,旨在通过大规模语言模型的推理能力,直接参与数学、物理和计算机科学的前沿研究。模型以 Gemini 系列为底座,加入了专用的Aletheia数学研究代理和多模态推理管线,实现了从文献检索、解题生成到结果验证的全链路自动化。

数学研究的里程碑

  • IMO 金牌水平:2025年夏季,Deep Think 在国际数学奥林匹克(IMO)模拟赛中达到金牌标准,随后在2026年1月的内部 IMO‑ProofBench Advanced 基准上取得 90% 以上正确率。
  • 自主论文生成:模型在无人工干预的情况下完成了《算术几何结构常数的计算》论文(Feng26),并在 Erdős‑1051 公开数据库中自行提出并证明了四个未解问题。
  • 人机协作案例:在《交互粒子系统的上界》研究中,Deep Think 与人类专家共同完成了定理证明(LeeSeo26),展示了“AI‑引导协作”模式的可行性。

计算机科学与物理的跨界应用

  • 算法难题突破:通过将连续数学工具(Kirszbraun 定理、Stone‑Weierstrass 定理)迁移至离散优化,模型成功解决了长期卡住的 Max‑CutSteiner Tree 问题。
  • 子模优化猜想反证:针对 2015 年提出的在线子模优化猜想,Deep Think 构造了三元组合反例,正式否定了该直觉。
  • 宇宙弦引力辐射:在物理分支,模型利用 Gegenbauer 多项式对奇点积分进行闭式求解,提供了宇宙弦辐射的解析表达。

人机协作的全新范式

DeepMind 将 Gemini Deep Think 定位为“智力倍增器”。模型通过自然语言验证器实时检测解答缺陷,能够主动承认失败并迭代改进;同时结合 Google Search 与网页浏览,实现文献的精准引用,避免了常见的幻觉与错误引用。

未来展望

报告指出,随着推理算力的进一步提升,Gemini Deep Think 在 PhD 级别的科研任务上将保持 降低推理算力 的同时提升推理质量。团队计划将该技术推广至生物医药、材料科学等更广泛的实验室工作流,构建跨学科的 AI 研究生态。

"AI 正在从工具转向伙伴,帮助科研人员专注于创新思考而非繁琐验证。" — DeepMind 项目负责人 Thang Luong


Gemini Deep Think 的发布标志着生成式 AI 在科研领域的首次系统化落地,预计将在未来数年内重塑学术出版、实验设计以及跨学科合作的格局。

本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。