AI狂热导致算力与Token堆砌,企业走向资源荒

39 阅读4分钟视野
AI狂热导致算力与Token堆砌,企业走向资源荒

产业狂热背后的两大信号

在本周的TechCrunch Equity 播客中,主持人聚焦了三件被业界热议的事件:

  1. OpenAI的并购狂潮——从个人理财应用Hiro到脱口秀节目,OpenAI正以资本快速布局垂直场景。
  2. Allbirds的业务转型——这家原本以可持续鞋履闻名的公司宣布将业务中心转向AI基础设施,甚至更名为“Allbirds AI”。
  3. Anthropic的新模型——Anthropic公开了一款自称“过于强大而无法公开发布”的模型,随后却在美联储主席鲍威尔面前进行演示。

这些看似独立的新闻,却共同映射出一个行业共性:算力与Token的盲目叠加(业内俗称“tokenmaxxing”),导致资源投入与实际产出之间的鸿沟不断扩大。


什么是Tokenmaxxing?

“Tokenmaxxing”是指企业在模型训练或推理阶段,为追求更高的Token吞吐量而不计成本地扩充算力、购买海量GPU/TPU,甚至在模型规模上盲目追求数十万亿参数。表面上看,这种做法可以提升生成质量和响应速度,但实质上往往带来三大问题:

  • 成本失控:算力租赁费用和能源消耗呈指数增长,超过大多数企业的预算上限。
  • 生态碎片化:不同公司各自为政的算力堆砌导致资源利用率低下,缺乏统一的调度与共享机制。
  • 创新瓶颈:过度关注硬件规模,忽视算法效率和数据质量的提升,真正的技术突破被埋在巨额开支之下。

案例拆解

OpenAI的并购路径

OpenAI近期收购了多款面向消费金融的应用(如Hiro)以及媒体内容生成平台。表面上是为了打造“一站式AI生态”,实质上是为了 锁定算力需求:每新增一个垂直产品,都意味着需要在后台部署更大的模型实例,以保证实时响应。此举在短期内提升了业务多样性,但也把算力需求推向更高的天花板。

Allbirds的跨界实验

Allbirds在2025年末完成鞋业业务的出售,随后宣布进入AI基础设施领域,计划打造自研GPU加速卡并提供云算力服务。该公司缺乏AI研发经验,却凭借品牌效应快速吸引资本。业内分析认为,这是一种 “品牌+算力” 的炒作手法,实际技术沉淀尚未可观

Anthropic的“太强模型”

Anthropic在本月的发布会上展示了一款据称“过于强大而无法公开发布”的模型,并在美联储主席鲍威尔面前进行实时演示。虽然演示效果惊艳,但背后隐藏的是 极高的算力成本:据估算,仅该模型的推理阶段每日需要消耗约10,000块A100 GPU。若将此模型商业化,费用几乎难以覆盖。


行业趋势与建议

面对日益膨胀的算力需求,行业专家提出了三条应对路径:

  1. 提升模型效率:通过稀疏化、Mixture‑of‑Experts(MoE)和LoRA等技术,在保持性能的前提下降低Token消耗。
  2. 算力共享平台:构建跨企业的算力交易市场,实现资源的弹性调度,降低单体企业的资本开支。
  3. 聚焦数据质量:相较于盲目扩张Token,提升数据标注质量和多模态对齐效果往往能带来更显著的性能提升。

只有在算力与算法、数据三者之间找到平衡,企业才能避免陷入“Tokenmaxxing”的资源荒,真正实现生成式AI的可持续增长。


“AI的未来不在于我们拥有多少GPU,而在于我们如何更聪明地使用每一次Token”。——业界资深研究员匿名

结语:从OpenAI的并购到Allbirds的跨界再到Anthropic的模型秀,2026年的AI赛道正被一股算力与Token的狂热所驱动。若不及时纠偏,行业将面临成本失控与创新停滞的“双重危机**。

本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。