AI狂热导致算力与Token堆砌,企业走向资源荒

产业狂热背后的两大信号
在本周的TechCrunch Equity 播客中,主持人聚焦了三件被业界热议的事件:
- OpenAI的并购狂潮——从个人理财应用Hiro到脱口秀节目,OpenAI正以资本快速布局垂直场景。
- Allbirds的业务转型——这家原本以可持续鞋履闻名的公司宣布将业务中心转向AI基础设施,甚至更名为“Allbirds AI”。
- Anthropic的新模型——Anthropic公开了一款自称“过于强大而无法公开发布”的模型,随后却在美联储主席鲍威尔面前进行演示。
这些看似独立的新闻,却共同映射出一个行业共性:算力与Token的盲目叠加(业内俗称“tokenmaxxing”),导致资源投入与实际产出之间的鸿沟不断扩大。
什么是Tokenmaxxing?
“Tokenmaxxing”是指企业在模型训练或推理阶段,为追求更高的Token吞吐量而不计成本地扩充算力、购买海量GPU/TPU,甚至在模型规模上盲目追求数十万亿参数。表面上看,这种做法可以提升生成质量和响应速度,但实质上往往带来三大问题:
- 成本失控:算力租赁费用和能源消耗呈指数增长,超过大多数企业的预算上限。
- 生态碎片化:不同公司各自为政的算力堆砌导致资源利用率低下,缺乏统一的调度与共享机制。
- 创新瓶颈:过度关注硬件规模,忽视算法效率和数据质量的提升,真正的技术突破被埋在巨额开支之下。
案例拆解
OpenAI的并购路径
OpenAI近期收购了多款面向消费金融的应用(如Hiro)以及媒体内容生成平台。表面上是为了打造“一站式AI生态”,实质上是为了 锁定算力需求:每新增一个垂直产品,都意味着需要在后台部署更大的模型实例,以保证实时响应。此举在短期内提升了业务多样性,但也把算力需求推向更高的天花板。
Allbirds的跨界实验
Allbirds在2025年末完成鞋业业务的出售,随后宣布进入AI基础设施领域,计划打造自研GPU加速卡并提供云算力服务。该公司缺乏AI研发经验,却凭借品牌效应快速吸引资本。业内分析认为,这是一种 “品牌+算力” 的炒作手法,实际技术沉淀尚未可观。
Anthropic的“太强模型”
Anthropic在本月的发布会上展示了一款据称“过于强大而无法公开发布”的模型,并在美联储主席鲍威尔面前进行实时演示。虽然演示效果惊艳,但背后隐藏的是 极高的算力成本:据估算,仅该模型的推理阶段每日需要消耗约10,000块A100 GPU。若将此模型商业化,费用几乎难以覆盖。
行业趋势与建议
面对日益膨胀的算力需求,行业专家提出了三条应对路径:
- 提升模型效率:通过稀疏化、Mixture‑of‑Experts(MoE)和LoRA等技术,在保持性能的前提下降低Token消耗。
- 算力共享平台:构建跨企业的算力交易市场,实现资源的弹性调度,降低单体企业的资本开支。
- 聚焦数据质量:相较于盲目扩张Token,提升数据标注质量和多模态对齐效果往往能带来更显著的性能提升。
只有在算力与算法、数据三者之间找到平衡,企业才能避免陷入“Tokenmaxxing”的资源荒,真正实现生成式AI的可持续增长。
“AI的未来不在于我们拥有多少GPU,而在于我们如何更聪明地使用每一次Token”。——业界资深研究员匿名
结语:从OpenAI的并购到Allbirds的跨界再到Anthropic的模型秀,2026年的AI赛道正被一股算力与Token的狂热所驱动。若不及时纠偏,行业将面临成本失控与创新停滞的“双重危机**。