Codex 周限额耗尽怎么办:7 种修复方案、限额机制和替代 API(2026)
(updated )

Codex 周限额耗尽怎么办:7 种修复方案、限额机制和替代 API(2026)

TL;DR

$20 Plus 套餐的 Codex 周限额,被一次长重构就可以在三小时内打空;OpenAI 唯一一次团队级重置发生在 2026 年 6 月 11 日。

限额触顶后你有两条路:等待滚动重置(Plus 每 5 小时滚一次,周限额按周重置),或者把 Codex CLI 的 OPENAI_BASE_URL 切到按 token 计费的 API。本文给你 30 秒诊断方法、Plus 和 Pro 的精确数学题,以及 7 种从「今天还能继续用 ChatGPT」到「60 秒切到按量 API」的具体修复方案。

Codex 挂了,还是你的周限额被打空?30 秒诊断

在切换供应商之前,先确认是哪个窗口爆了。在任何打开的 Codex CLI 会话里跑:

codex /status

输出会显示三个数字。对照下表:

诊断上下文窗口5 小时窗口周窗口处理方式
周限额触顶任意>10%<5%套餐层面问题 —— 升级或切 API key
5 小时限额触顶任意<5%>20%等下一次 5 小时滚动(最多 5h)
上下文溢出<5%>20%>20%压缩会话或拆任务
幻象限额(issue #19215)>40%>50%>50%重启 Codex CLI;若仍报错,切 base_url

如果 /status 显示容量正常但仍然看到 You've hit your usage limit. To get more access now, send a request to your admin or try again at 3:51 PM,那就是 #19215 幻象限额 bug(2026 年 4 月 23 日在 Codex CLI v0.124.0 上报告)。直接跳到方案 #4。

常见 Codex 报错文案 → 原因 → 修复

Codex 打印出的字面文案是分诊最快的依据,对应到下表:

报错文案(原文)可能原因对应方案
You've hit your usage limit. ... try again at HH:MM PM真实的 5 小时或周限额方案 #1(等)或 #5/#6(API 路径)
You've hit your usage limit,但 /status 显示剩余 >50%CLI v0.124.0 的幻象限额 bug(#19215)方案 #4(清 sessions 缓存)
CLI 提示里出现 request a free reset 按钮还能领取免费重置(6 月 11 日之后)方案 #2(领取免费重置)
API 模式下 HTTP 报 429 Too Many Requests直连 API 突发流量限流回退重试、降并发,或方案 #6(设每 key 预算)
API 模式下 HTTP 报 insufficient_quotaOpenAI 账户支出上限触顶提高控制台支出上限或切 base_url
You've reached your weekly limit,无重置按钮本次发布的免费重置已用方案 #3(升级套餐)或 #5/#6(API)
context_length_exceeded会话太长,不是套餐限额codex /compact 或开新会话

什么时候修限额,什么时候直接切到按量 API

不是所有限额触顶都值得绕开。把你的处境对到下面的规则:

继续修现有套餐的限额。 本周第一次触顶,/status 显示是正常限额(不是幻象 bug),手上跑的任务接近收尾、不是新开一个多小时的 agent 循环。6 月 11 日的团队级 reset banking 给每个用户存了一次免费重置,你可能本来就有一次可用。

直接切到按 token 计费的 API。 每个月超过两次打满周限额,agent 工作流单次会话动辄 30 万+ 输入 token,需要每个任务有可预估的成本(比如给客户报价),或者在 CI 和共享开发环境里 —— 分层 ChatGPT 鉴权本来就不适合。

停止规则。 如果 /status 显示剩余容量充足、当天只触顶一次,什么都别做。5 小时滚动窗口会自动恢复,为一次偶发问题切换供应商是过度工程。关掉这个 tab 写代码去。

解读 Codex 限额:套餐、窗口、各档实际能给到什么

Codex CLI 继承的是当前鉴权路径的限额。三个订阅档位和 API 路径各有不同的上限。

订阅档位的 5 小时消息上限

ChatGPT 订阅档位通过滚动 5 小时窗口里的消息数对 Codex 使用做限流,而不是 token。公布的区间很宽,因为每条「消息」会按模型和任务复杂度加权。

套餐月费GPT-5.5 消息/5hGPT-5.4 消息/5hGPT-5.3-Codex 消息/5h
Free$0无(用 Codex 至少需要 Plus)
Plus$2015-8020-10045-225
Pro 5x$10075-400100-500225-1,125
Pro 20x$200300-1,600400-2,000900-4,500
Business按席位视席位分配

来源:OpenAI Codex rate cardCodex 定价文档,数据在 2026 年 6 月 15 日核对。Plus(15-80)和 Pro 20x(300-1,600)有第三方社区报告佐证;Pro 5x 的 75-400 区间目前只来自官方 rate card,撰稿时尚无第三方交叉验证。

宽区间(如「15-80」)反映 OpenAI 会根据平台总负载和个人使用模式动态调整上限。区间下限就是繁忙时段你能实际拿到的数。

周限额机制

周限额叠加在 5 小时窗口之上。周限额从你本周第一条消息开始,以 7 天滚动重置。两个窗口独立计算 —— 数学问题就在这里。

GPT-5.5 上一次多文件 agent 循环(输入重型:约 25 万 token / 输出约 2.5 万)在 5 小时口径上大约等价 30-40 条消息,但在周窗口上算一次「会话」。Plus 用户连跑 2-3 次重型重构就足以打空周限额,而 5 小时计量盘可能还显示 30%+ 剩余。

API key 路径(无消息上限)

如果 OPENAI_API_KEY 以 sk- 开头且是普通 API key,Codex CLI 完全绕开订阅档位上限。按 token 走 API 定价表,无周消息上限,只受你在控制台设置的支出上限约束。这是应对周限额触顶最干净的方案,下面给出具体数学。

为什么一次 agent 循环就能打空一整周

Codex 周限额不直观的点在于:它不和 /status 看到的消息数成线性关系。OpenAI 的 Codex 定价文档 给出了 credit 的底层算法:

  • GPT-5.5 每 1M 输入 token 消耗 125 credit、缓存 12.50、每 1M 输出 750
  • GPT-5.4 是 62.50 / 6.25 / 375
  • GPT-5.4 mini 是 18.75 / 1.875 / 113

一次 GPT-5.5 的 agent 循环读 30 个文件(约 25 万输入 token)、产出 2.5 万 token 的方案/diff,大约消耗:

输入:  250,000 × 125/1M = 31.25 credit
输出:  25,000  × 750/1M = 18.75 credit
合计:                     ≈ 50 credit / 次

Plus 套餐的周 GPT-5.5 预算视平台总负载浮动,平均落在 250-300 credit 区间。六次这样的 agent 循环就能掏空整周 —— 而 /status 的 5 小时盘可能还显示 40%+ 剩余,因为 5 小时窗口按消息算,不按 credit。这就解释了 #19215 里用户看到的反差:5 小时还剩很多,周窗口已耗尽。

结构性修复是:重型 agent 循环走 API key(按美元结算,没有 credit 记账),订阅留给交互式对话。

「You’ve Hit Your Usage Limit」修复方案(覆盖每个档位)

下面 7 种方案按破坏性从小到大排列。挑第一个匹配你处境的方案,看完就停。

方案 #1 — 等 5 小时滚动重置(Free / Plus,轻度用量)

如果 /status 显示 5 小时窗口剩余 <5%、但周窗口在 30% 以上,等就行。精确的重置时间戳在 /status 里 —— 通常在你最后一次突发用量后 3-5 小时内。

等的过程里,有产出的做法是把 IDE 切到手动编码模式,或用一个不共享这套限额的非 Codex 工具(任何 IDE 端自动补全都行)。

方案 #2 — 领取免费重置(2026 年 6 月 11 日 changelog)

2026 年 6 月 11 日的 Codex changelog 引入了「rate-limit reset banking」,在功能上线时给 Plus 和 Pro 用户各发一次免费重置。如果你还没领,触顶时 Codex CLI 会显示选项;CLI ≥ v0.135 也支持 codex /reset 命令。

每次发布事件每用户一次。如果 OpenAI 又发了一次重置(5 月 15 日 Tibo 在 X 上宣布的那次是团队级,不消耗 banking 的那一次),先看 changelog 公告再决定要不要烧掉手上唯一一次 banking 重置。

方案 #3 — 升级套餐档位

如果你每周都在打空 Plus 的周限额,Pro 5x($100)给到 5 倍消息预算,Pro 20x($200)给 20 倍。和走 API 路径的盈亏平衡点大致是:

路径月费能得到什么API 平衡点
Plus$2015-80 GPT-5.5 msgs/5h每周 3-5 次重型会话
Pro 5x$10075-400 GPT-5.5 msgs/5h每月 100 次轻或 25-30 次重
Pro 20x$200300-1,600 GPT-5.5 msgs/5h每月 80 次重
API key(直连)$0 + 用量按 token 付费,无上限用量线性
API key(ofox,旗舰打 85 折)$0 + 用量按 token 付费,无上限每次重型会话约 $0.80

如果你的用量模式是「偶尔爆发式重型工作」,API 路径几乎稳赢。订阅只有在用量稳定可预测时才划算。

方案 #4 — 幻象限额绕开方法(issue #19215)

如果 /status 显示容量正常但 Codex 仍然以 usage limit 拒绝请求,你撞上了 #19215。这个 bug 在 Codex CLI v0.124.0 出现(issue 提交时仍未修复)。可行步骤:

codex /quit
rm -rf ~/.codex/sessions/*
codex

清掉本地会话缓存可以解决多数报告案例。如果仍未解决,把日志发到 issue 帖里反馈,并切到方案 #5(API key 路径)保持工作不中断。

方案 #5 — 把 OPENAI_BASE_URL 切到 OpenAI 直连 API 端点

最干净的「我只想继续写代码」方案。在 platform.openai.com/api-keys 生成一个 OpenAI API key(sk- 开头那种,不是 sk-proj- 的 ChatGPT 绑定 key),然后:

export OPENAI_API_KEY=sk-your-api-key
export OPENAI_BASE_URL=https://api.openai.com/v1
codex

Codex 此时打的是按 token 计费的 API,而不是你的 ChatGPT 订阅。成本按 token 算。一次小 bug 修复在 GPT-5.5 上大约 $0.40,多文件重构(约 30 万输入 / 3 万输出)大约 $2.40 —— 都远低于一次「需要付费」的 banking 重置。

权衡:你会失去 ChatGPT 捆绑的云端功能(Slack 集成、Codex dashboard 里的 GitHub 评审)。如果只做纯 CLI 工作,这是最高杠杆的方案。

方案 #6 — 把 OPENAI_BASE_URL 切到兼容 OpenAI 的按量 API

和方案 #5 同形态,区别在于走的是聚合多模型、统一 key、暴露每 key 预算的供应商。下面例子用 ofox,但这套模式适用于任何兼容 OpenAI 的端点。

export OPENAI_API_KEY=ofox-your-key-here
export OPENAI_BASE_URL=https://api.ofox.ai/v1
codex

ChatGPT 订阅已打空时,这条路相比直连 OpenAI 有三点优势:

  1. 旗舰模型更便宜。ofox 上 openai/gpt-5.3-codex 是输入 $1.49 / 输出 $11.90 每百万 token,相比 OpenAI 官方 $1.75 / $14.00 打 85 折。OpenAI 直连 $0.95 的同款重构在这里约 $0.80。
  2. 模型可无缝切换。ofox 上 openai/gpt-5.4-mini 是输入 $0.638 / 输出 $3.83 每百万 token,便宜到可以当作迭代工作的默认模型,把 gpt-5.3-codex 留给硬重构。
  3. 每 key 预算。ofox 在 dashboard 上暴露每个 key 的月度上限。设成 $50/月,不管 agent 循环跑得多猛都不会超。

ofox Codex 集成文档 和深度版的 Codex CLI 自定义端点指南 涵盖了模型级调优。

方案 #7 — 通过 ~/.codex/config.toml 做多供应商路由

如果你的团队或个人想让 gpt-5.3-codex 跑硬重构、便宜模型跑迭代,配置两个供应商让 Codex 切换:

[model_providers.ofox]
name = "OfoxAI"
base_url = "https://api.ofox.ai/v1"
wire_api = "responses"

[model_providers.openai_direct]
name = "OpenAI Direct"
base_url = "https://api.openai.com/v1"
wire_api = "responses"

[profiles.fast]
model = "openai/gpt-5.4-mini"
model_provider = "ofox"

[profiles.heavy]
model = "openai/gpt-5.3-codex"
model_provider = "ofox"

按需切换:硬活用 codex --profile heavy,迭代用 codex --profile fast。完整 schema 见 Codex CLI config.toml 深度解析

Codex 限额事件:2026 年的真实节奏

今年和周限额相关的事件时间线。盯节奏是预判下一次的唯一办法。

日期事件来源影响
2026 年 4 月 23 日#19215 提交 —— /status 显示容量正常但 Codex CLI 以「usage limit」拒绝;GPT-5.5、Business 套餐、CLI v0.124.0openai/codex#19215影响 CLI v0.124.0 用户中的未知比例;解法是清本地缓存
2026 年 4 月下旬Codex 周活达到 300 万;OpenAI 宣布团队级 rate-limit 重置Knightli 复盘一次性重置
2026 年 5 月 15 日Tibo(OpenAI)在 X 发文:持续监控中,当晚发出手动重置同 Knightli 复盘应激式重置,未永久提高上限
2026 年 6 月 11 日changelog 新增「rate-limit reset banking」—— 每用户一次免费重置Codex changelog首个用户自助的重置机制;一次性
2026 年 6 月 4 日Bedrock 模型支持 —— Codex 可走 Amazon 托管的配额Codex changelog间接缓解:用 Bedrock 端配额,而非 ChatGPT 档位

规律很清楚:OpenAI 给的是战术性重置而不是永久性提高上限。一个月内打满两次的 Plus 和 Pro 用户应该开始为 API 路径做准备,不要再赌第三次重置。

限额不会自己回来时:现在就能用的按量 API 替代方案

如果你等不起,按切换成本排序的几个选项如下。先看核心对比:

供应商base_urlgpt-5.3-codex 输入 $/Mgpt-5.3-codex 输出 $/M每 key 预算切换耗时
ofoxhttps://api.ofox.ai/v1$1.49$11.90支持(dashboard)约 60s(2 个环境变量)
OpenAI 直连https://api.openai.com/v1$1.75$14.00仅账户级约 60s(2 个环境变量)
Amazon Bedrock(Bedrock 代理)视区域视区域AWS 账户级上限10-30 分钟(IAM + 区域)
换编码工具不适用(例如 Claude Code)不适用 —— 不同模型不适用视供应商数小时(重写工作流)

来源:定价在 2026 年 6 月 15 日核对 ofox 模型目录Codex 定价文档

方案 A — ofox(兼容 OpenAI 的替换)

优点:旗舰 OpenAI 模型打 85 折,每 key 支出上限,若同时用 Claude/Gemini 还能合并账单,Codex CLI 是官方支持的客户端。

怎么切:两个环境变量。OPENAI_BASE_URL=https://api.ofox.ai/v1OPENAI_API_KEY 设成 ofox key。重启 Codex。总耗时不到 60 秒。

API 模型 IDopenai/gpt-5.3-codexopenai/gpt-5.5openai/gpt-5.4openai/gpt-5.4-mini。完整目录见 ofox 模型目录

方案 B — OpenAI 直连 API

优点:和 ChatGPT 套餐同一家,不存在第三方信任问题,模型阵容完整。

缺点:官方定价(没有折扣),没有脚本支持就没有每 key 预算。

怎么切:在 platform.openai.com/api-keys 拿一个 sk- API key,OPENAI_BASE_URL=https://api.openai.com/v1。重启 Codex。

方案 C — Amazon Bedrock(2026 年 6 月 4 日上线)

优点:配额走你的 AWS 账户,本身已经付 AWS 的账时合适。

缺点:模型目录仅限 AWS(当前是 OpenAI 的一个子集),区域可用性受限,鉴权比环境变量复杂。

怎么切:配置 Bedrock 凭证,OPENAI_BASE_URL 指向 Bedrock 代理端点。具体步骤看 changelog。

方案 D — 直接换编码工具

如果 Codex CLI 周限额一直在咬你,也可以转 Claude Code(用 claude-opus-4-8,2026 年 6 月在 Anthropic 当前的旗舰,并已在 ofox marketplace 上线)或其他编码 agent。摩擦在配置重写 —— 你的 Codex AGENTS.md、提示词、harness 习惯不能干净迁移。这条路留给「我决定不再用 Codex」,不是「我今天得交活」。

工作流迁移的具体差异可看 Codex 真实编码工作流

怎么监控 Codex 状态、给未来烧钱设上限

止血之后,给自己安一套防再次撞墙的机制。

每次重活前都 /status 一下

把它做成反射动作。任何超过 10 万输入 token 的任务都先 /status。如果有一个窗口剩余低于 30%,本次会话直接切到 API key 鉴权。

订阅 OpenAI 状态页

status.openai.com 近实时显示 API 故障和 Codex 降级。订阅邮件或 RSS —— Codex 出问题时你想第一时间知道,而不是先花 10 分钟怀疑自己配置坏了。

跟踪 Codex CLI 版本号

幻象限额 bug(#19215)绑定 CLI v0.124.0。固定到一个已知良好版本:

npm install -g @openai/codex@0.135.0

codex --version 查当前版本。新版本起码用一周,让回归 bug 暴露出来再升级。

走 API 鉴权时设每 key 支出上限

切到按量 API 后(方案 #5/#6),设一个硬上限。OpenAI 直连在 dashboard「Spend limits」里,ofox 在 keys 页面的每 key 月度上限。单开发者的合理起步上限:$50/月。看完一个月真实烧钱再调。

用 10 行 shell hook 看每日支出

比起等 dashboard 告警,更务实的做法是本地记每次 Codex 会话的 token 数,再累加日总。把下面这段丢到 ~/.codex/hooks/post-session.sh

#!/bin/bash
# 把每次会话的 token 数追加到 ~/.codex/spend.log
LOG=~/.codex/spend.log
TS=$(date -u +%Y-%m-%dT%H:%M:%SZ)
echo "$TS in=$CODEX_INPUT_TOKENS out=$CODEX_OUTPUT_TOKENS model=$CODEX_MODEL" >> "$LOG"

读今日总量:

grep "^$(date -u +%Y-%m-%d)" ~/.codex/spend.log | \
  awk '{for(i=1;i<=NF;i++){if($i~/^in=/){gsub("in=","",$i);ins+=$i};if($i~/^out=/){gsub("out=","",$i);outs+=$i}}} \
       END{printf "today: %d input / %d output tokens\n", ins, outs}'

得不到精确到美元的账单(模型价位会让换算复杂),但你能在下一次开 agent 循环之前看到「今天已经烧了 80 万 token」。仅这一个行为提示,实践中通常让周烧量下降 20-30%。

默认用便宜模型

迭代工作最便宜可靠的模型是 ofox 上的 openai/gpt-5.4-mini,输入 $0.638/百万 token。把它设成 Codex CLI 默认模型,只在确实需要旗舰编码能力时切到 gpt-5.3-codex。这种模式跑一周通常能砍掉一半支出。

更宽的模式可见 自定义模型供应商 BYO 配置指南

团队共享配置(多人开发场景)

如果团队里 3 人以上都在打满同一个周限额,个人 ChatGPT 订阅已经不是合适的形状。经济账翻转:

  • 5 个开发者 × $20 Plus = $100/月,但限额各自计算且不可预测
  • 5 个开发者 × 共享 API key + $50/月上限 = 可预测的 $250/月封顶,用量池化

ofox 大多数客户用的团队共享模式是按环境(dev、staging、ci)一个 API key,而不是按开发者。config.toml 放仓库里,环境变量从每个开发者的密钥管理器拿。可以提交到仓库的示例:

# .codex/config.toml — 提交到仓库
[model_providers.team]
name = "Team Shared (ofox)"
base_url = "https://api.ofox.ai/v1"
wire_api = "responses"
# 鉴权走每个开发者的 $OPENAI_API_KEY(开发者本地环境,不进仓库)

[profiles.default]
model = "openai/gpt-5.4-mini"
model_provider = "team"

[profiles.heavy]
model = "openai/gpt-5.3-codex"
model_provider = "team"

每个开发者本地设自己的 OPENAI_API_KEY(指向密钥管理器里的每人或每团队 key)。支出监控集中到一块 ofox dashboard,而不是五个独立的 ChatGPT 账号。CI 管道用单独一个 key,每次跑配更严格的上限。

相对个人 ChatGPT 订阅的差别:一个开发者跑了一次 $4 token 成本的重构,整个团队在一个 dashboard 上看得见。五个独立 ChatGPT 订阅同一周各自打满周限额时,你既没有可见性也没有共享预算。

关于真实性和成本的一段话

把 Codex CLI 从 $20 ChatGPT 套餐切到兼容 OpenAI 的 API 上跑,gpt-5.3-codex 上一次小 bug 修复成本约 $0.13 —— 比订阅在某个糟糕下午被幻象限额浪费掉的额度还少。

这就是真实的算术。ChatGPT 订阅在用量稳定、在上限以内时是好东西。一旦用量变成爆发形状 —— 重构周、CI 死线、单次 agent 循环触碰 30 个文件 —— 订阅上限就是错误的抽象。Token 计费按实际用量付费,让你能继续交活。

本轮更新核对过的来源