OpenAI推出实时额度系统,让Codex与Sora使用不中断

44 阅读2分钟视野
OpenAI推出实时额度系统,让Codex与Sora使用不中断

背景

过去一年,OpenAI的代码生成模型Codex和文本生成视频模型Sora因强劲需求频繁触达速率上限。传统的单一限流或使用计费方式已无法兼顾公平性与灵活性,导致用户在获得价值后被硬性中断。

传统模型的局限

  • 速率限制:可以平滑流量,但在用户仍有需求时会出现“请稍后再试”。
  • 使用计费:虽支持按量付费,却缺乏实时反馈,用户容易在使用高峰期产生超额费用。

实时额度与信用体系

OpenAI构建了一个实时访问引擎,核心思路是把额度视为“瀑布”式决策链:

  1. 先从免费速率额度消费;
  2. 若耗尽,立即检查用户信用余额;
  3. 余额充足则自动扣减继续服务;
  4. 若余额不足则返回明确的阻断信息。

该机制在单次请求中完成判断,保证毫秒级响应,同时所有扣减操作以幂等方式写入异步流水线,形成完整审计链。

系统实现关键

  • 分布式计数:对每个用户、每个特性维护独立的使用计数和信用余额。
  • 原子事务:信用扣减与计费事件在同一数据库事务中完成,防止并发竞争导致双扣。
  • 幂等事件 ID:每次请求携带稳定的幂等键,重试或服务恢复时不会重复计费。
  • 近实时审计:使用事件流记录使用、计费、余额更新三类数据,支持离线对账与即时异常检测。

对用户的实际意义

  • 连续创作:开发者在写代码或生成视频时不必担心突发的速率阻断,体验更流畅。
  • 透明计费:每一次额度消耗都有可追溯的记录,用户可以随时查询为何被允许或被阻止。
  • 灵活付费:通过购买信用额度,企业用户可以在高峰期保持高并发,避免因速率限制而导致业务停滞。

OpenAI 表示,该实时额度系统已经在 Codex 与 Sora 上全面上线,未来将作为统一的访问控制框架,逐步推广至更多模型和服务,实现“使用不中断、计费可追溯”。

本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。