DeepMind发布Aletheia代理,首次自主破解Erdős-1051难题
•32 阅读•3分钟•前沿
GeminiDeepMindAletheiaErdős-1051
•32 阅读•3分钟•前沿

背景
Erdős‑1051是数学家保罗·埃尔德什提出的数论难题,长期以来仅有人工或半自动化尝试,尚未出现完整的自主求解案例。近期DeepMind在GitHub公开的“superhuman”仓库中,提交了名为Aletheia的推理代理代码及实验记录,引发学界广泛关注。
Aletheia代理概览
- 核心模型:基于Gemini Deep Think的大规模语言模型,具备多轮推理和自我校验能力。
- 工作流:
- 接收数学陈述并生成初始解答草案;
- 通过内部验证模块检验逻辑一致性;
- 若发现矛盾,自动回溯并重新构造证明。
- 输出形式:提供LaTeX格式的完整证明、PDF全文以及对应的数学推导代码。
自主破解Erdős‑1051
Aletheia在公开的实验目录中展示了对Erdős‑1051的完整求解过程。该过程包括:
- 对快速收敛级数的无理性进行一般化证明;
- 计算算术Hirzebruch比例原理的特征权重;
- 在强多项式迭代框架下验证特定数值组合的多二进制区间覆盖性。
所有结果均以.tex和.pdf文件形式提供,未见人工干预的痕迹,表明系统在整个求解链路上实现了自主决策。
业界意义
- 数学研究自动化里程碑:首次出现AI在未经人工校正的情况下完整解决公开数学难题。
- 验证与可重复性:代码、提示词与输出均已开源,其他研究团队可直接复现或基于此进行扩展。
- 跨领域应用潜力:类似的迭代验证框架可迁移至化学合成、材料设计等需要严谨推理的科学领域。
展望
DeepMind已表示将进一步发布Aletheia的技术细节与模型权重,预计将在近期的学术会议上提供更系统的论文。业界普遍认为,此举将加速AI在高阶数学、理论物理等前沿科学中的渗透,并可能重塑科研工作流。
“AI能够在不依赖人类专家的情况下完成高难度数学证明,这标志着推理人工智能进入了全新阶段。”——DeepMind技术博客(预览)
本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。