DeepMind发布Aletheia代理，首次自主破解Erdős-1051难题

2026/02/02 (周一)•32 阅读•3分钟•前沿

GeminiDeepMindAletheiaErdős-1051

2026/02/02 (周一)•32 阅读•3分钟•前沿

DeepMind发布Aletheia代理，首次自主破解Erdős-1051难题

背景

Erdős‑1051是数学家保罗·埃尔德什提出的数论难题，长期以来仅有人工或半自动化尝试，尚未出现完整的自主求解案例。近期DeepMind在GitHub公开的“superhuman”仓库中，提交了名为Aletheia的推理代理代码及实验记录，引发学界广泛关注。

Aletheia代理概览

核心模型：基于Gemini Deep Think的大规模语言模型，具备多轮推理和自我校验能力。
工作流：
1. 接收数学陈述并生成初始解答草案；
2. 通过内部验证模块检验逻辑一致性；
3. 若发现矛盾，自动回溯并重新构造证明。
输出形式：提供LaTeX格式的完整证明、PDF全文以及对应的数学推导代码。

自主破解Erdős‑1051

Aletheia在公开的实验目录中展示了对Erdős‑1051的完整求解过程。该过程包括：

对快速收敛级数的无理性进行一般化证明；
计算算术Hirzebruch比例原理的特征权重；
在强多项式迭代框架下验证特定数值组合的多二进制区间覆盖性。

所有结果均以.tex和.pdf文件形式提供，未见人工干预的痕迹，表明系统在整个求解链路上实现了自主决策。

业界意义

数学研究自动化里程碑：首次出现AI在未经人工校正的情况下完整解决公开数学难题。
验证与可重复性：代码、提示词与输出均已开源，其他研究团队可直接复现或基于此进行扩展。
跨领域应用潜力：类似的迭代验证框架可迁移至化学合成、材料设计等需要严谨推理的科学领域。

展望

DeepMind已表示将进一步发布Aletheia的技术细节与模型权重，预计将在近期的学术会议上提供更系统的论文。业界普遍认为，此举将加速AI在高阶数学、理论物理等前沿科学中的渗透，并可能重塑科研工作流。

“AI能够在不依赖人类专家的情况下完成高难度数学证明，这标志着推理人工智能进入了全新阶段。”——DeepMind技术博客（预览）

本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方，仅供参考使用。点击此处查看消息源。