Anthropic宣称递归自我提升已成现实，Claude 3.7 Sonnet推迟发布引发业界关注

2026/03/12 (周四)•6 阅读•2分钟•视野

生成式AIAnthropicDario AmodeiClaude 3.7

2026/03/12 (周四)•6 阅读•2分钟•视野

关键进展

递归自我提升已落地：Anthropic 首席科学官 Jared Kaplan 与对齐团队负责人 Evan Hubinger 均表示，模型已在内部实现“递归自我改进”，代码贡献比例高达 70%‑90%。
Claude 3.7 Sonnet：新一代模型在语言理解和推理上较 Claude 3.5 提升约 15%，但因安全评估仍存争议，发布被迫推迟 10 天。

安全审查与发布延迟

Anthropic 在内部备忘录中写道，尽管新模型性能显著，却在多轮安全压力测试后仍出现潜在风险。为确保“红线”未被突破，公司决定在确认安全后才对外发布，此举在行业内被视为罕见的审慎操作。

“我们应当把 2026‑2030 年视为关键窗口期，模型速度与能力的提升可能超出人类监管能力。” — Graham（Anthropic 高层）

行业与社会冲击

岗位替代：前 OpenAI 联合创始人 Dario Amodei 警告，未来五年内，入门级白领岗位可能被大模型取代，导致大规模“低薪下层”。
军事实用：Anthropic 公开表示愿意将其工具用于美国国防，声称这是抵御其他威权国家 AI 军备竞赛的唯一办法。
资本市场反应：新模型延迟公布后，Anthropic 股价出现短暂回撤，投资者担忧监管风险可能侵蚀商业前景。

前景展望

技术路径：若递归自我提升继续加速，模型研发周期可能从数月压缩至数周，行业竞争格局将被重新洗牌。
监管需求：美国国会已启动针对生成式 AI 的立法讨论，Anthropic 的安全姿态或成为政策制定的参考案例。
社会应对：面对潜在的就业结构性冲击，学者呼吁提前探索基本收入、再培训等宏观政策，以缓冲技术失业的冲击。

Anthropic 的最新动向提醒业界：技术突破与安全治理必须同步推进，否则高速迭代的模型可能在未被充分审查的情况下进入生产环境，带来不可预见的风险。

本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方，仅供参考使用。点击此处查看消息源。