DeepMind发布Aletheia代理,首次自主破解Erdős-1051难题

32 阅读3分钟前沿
DeepMind发布Aletheia代理,首次自主破解Erdős-1051难题

背景

Erdős‑1051是数学家保罗·埃尔德什提出的数论难题,长期以来仅有人工或半自动化尝试,尚未出现完整的自主求解案例。近期DeepMind在GitHub公开的“superhuman”仓库中,提交了名为Aletheia的推理代理代码及实验记录,引发学界广泛关注。

Aletheia代理概览

  • 核心模型:基于Gemini Deep Think的大规模语言模型,具备多轮推理和自我校验能力。
  • 工作流
    1. 接收数学陈述并生成初始解答草案;
    2. 通过内部验证模块检验逻辑一致性;
    3. 若发现矛盾,自动回溯并重新构造证明。
  • 输出形式:提供LaTeX格式的完整证明、PDF全文以及对应的数学推导代码。

自主破解Erdős‑1051

Aletheia在公开的实验目录中展示了对Erdős‑1051的完整求解过程。该过程包括:

  • 对快速收敛级数的无理性进行一般化证明;
  • 计算算术Hirzebruch比例原理的特征权重;
  • 在强多项式迭代框架下验证特定数值组合的多二进制区间覆盖性。

所有结果均以.tex和.pdf文件形式提供,未见人工干预的痕迹,表明系统在整个求解链路上实现了自主决策。

业界意义

  1. 数学研究自动化里程碑:首次出现AI在未经人工校正的情况下完整解决公开数学难题。
  2. 验证与可重复性:代码、提示词与输出均已开源,其他研究团队可直接复现或基于此进行扩展。
  3. 跨领域应用潜力:类似的迭代验证框架可迁移至化学合成、材料设计等需要严谨推理的科学领域。

展望

DeepMind已表示将进一步发布Aletheia的技术细节与模型权重,预计将在近期的学术会议上提供更系统的论文。业界普遍认为,此举将加速AI在高阶数学、理论物理等前沿科学中的渗透,并可能重塑科研工作流。

“AI能够在不依赖人类专家的情况下完成高难度数学证明,这标志着推理人工智能进入了全新阶段。”——DeepMind技术博客(预览)

本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。