Codex 周限额耗尽怎么办:7 种修复方案、限额机制和替代 API(2026)
TL;DR
$20 Plus 套餐的 Codex 周限额,被一次长重构就可以在三小时内打空;OpenAI 唯一一次团队级重置发生在 2026 年 6 月 11 日。
限额触顶后你有两条路:等待滚动重置(Plus 每 5 小时滚一次,周限额按周重置),或者把 Codex CLI 的 OPENAI_BASE_URL 切到按 token 计费的 API。本文给你 30 秒诊断方法、Plus 和 Pro 的精确数学题,以及 7 种从「今天还能继续用 ChatGPT」到「60 秒切到按量 API」的具体修复方案。
Codex 挂了,还是你的周限额被打空?30 秒诊断
在切换供应商之前,先确认是哪个窗口爆了。在任何打开的 Codex CLI 会话里跑:
codex /status
输出会显示三个数字。对照下表:
| 诊断 | 上下文窗口 | 5 小时窗口 | 周窗口 | 处理方式 |
|---|---|---|---|---|
| 周限额触顶 | 任意 | >10% | <5% | 套餐层面问题 —— 升级或切 API key |
| 5 小时限额触顶 | 任意 | <5% | >20% | 等下一次 5 小时滚动(最多 5h) |
| 上下文溢出 | <5% | >20% | >20% | 压缩会话或拆任务 |
| 幻象限额(issue #19215) | >40% | >50% | >50% | 重启 Codex CLI;若仍报错,切 base_url |
如果 /status 显示容量正常但仍然看到 You've hit your usage limit. To get more access now, send a request to your admin or try again at 3:51 PM,那就是 #19215 幻象限额 bug(2026 年 4 月 23 日在 Codex CLI v0.124.0 上报告)。直接跳到方案 #4。
常见 Codex 报错文案 → 原因 → 修复
Codex 打印出的字面文案是分诊最快的依据,对应到下表:
| 报错文案(原文) | 可能原因 | 对应方案 |
|---|---|---|
You've hit your usage limit. ... try again at HH:MM PM | 真实的 5 小时或周限额 | 方案 #1(等)或 #5/#6(API 路径) |
You've hit your usage limit,但 /status 显示剩余 >50% | CLI v0.124.0 的幻象限额 bug(#19215) | 方案 #4(清 sessions 缓存) |
CLI 提示里出现 request a free reset 按钮 | 还能领取免费重置(6 月 11 日之后) | 方案 #2(领取免费重置) |
API 模式下 HTTP 报 429 Too Many Requests | 直连 API 突发流量限流 | 回退重试、降并发,或方案 #6(设每 key 预算) |
API 模式下 HTTP 报 insufficient_quota | OpenAI 账户支出上限触顶 | 提高控制台支出上限或切 base_url |
You've reached your weekly limit,无重置按钮 | 本次发布的免费重置已用 | 方案 #3(升级套餐)或 #5/#6(API) |
context_length_exceeded | 会话太长,不是套餐限额 | codex /compact 或开新会话 |
什么时候修限额,什么时候直接切到按量 API
不是所有限额触顶都值得绕开。把你的处境对到下面的规则:
继续修现有套餐的限额。 本周第一次触顶,/status 显示是正常限额(不是幻象 bug),手上跑的任务接近收尾、不是新开一个多小时的 agent 循环。6 月 11 日的团队级 reset banking 给每个用户存了一次免费重置,你可能本来就有一次可用。
直接切到按 token 计费的 API。 每个月超过两次打满周限额,agent 工作流单次会话动辄 30 万+ 输入 token,需要每个任务有可预估的成本(比如给客户报价),或者在 CI 和共享开发环境里 —— 分层 ChatGPT 鉴权本来就不适合。
停止规则。 如果 /status 显示剩余容量充足、当天只触顶一次,什么都别做。5 小时滚动窗口会自动恢复,为一次偶发问题切换供应商是过度工程。关掉这个 tab 写代码去。
解读 Codex 限额:套餐、窗口、各档实际能给到什么
Codex CLI 继承的是当前鉴权路径的限额。三个订阅档位和 API 路径各有不同的上限。
订阅档位的 5 小时消息上限
ChatGPT 订阅档位通过滚动 5 小时窗口里的消息数对 Codex 使用做限流,而不是 token。公布的区间很宽,因为每条「消息」会按模型和任务复杂度加权。
| 套餐 | 月费 | GPT-5.5 消息/5h | GPT-5.4 消息/5h | GPT-5.3-Codex 消息/5h |
|---|---|---|---|---|
| Free | $0 | 无(用 Codex 至少需要 Plus) | 无 | 无 |
| Plus | $20 | 15-80 | 20-100 | 45-225 |
| Pro 5x | $100 | 75-400 | 100-500 | 225-1,125 |
| Pro 20x | $200 | 300-1,600 | 400-2,000 | 900-4,500 |
| Business | 按席位 | 视席位分配 | — | — |
来源:OpenAI Codex rate card 和 Codex 定价文档,数据在 2026 年 6 月 15 日核对。Plus(15-80)和 Pro 20x(300-1,600)有第三方社区报告佐证;Pro 5x 的 75-400 区间目前只来自官方 rate card,撰稿时尚无第三方交叉验证。
宽区间(如「15-80」)反映 OpenAI 会根据平台总负载和个人使用模式动态调整上限。区间下限就是繁忙时段你能实际拿到的数。
周限额机制
周限额叠加在 5 小时窗口之上。周限额从你本周第一条消息开始,以 7 天滚动重置。两个窗口独立计算 —— 数学问题就在这里。
GPT-5.5 上一次多文件 agent 循环(输入重型:约 25 万 token / 输出约 2.5 万)在 5 小时口径上大约等价 30-40 条消息,但在周窗口上算一次「会话」。Plus 用户连跑 2-3 次重型重构就足以打空周限额,而 5 小时计量盘可能还显示 30%+ 剩余。
API key 路径(无消息上限)
如果 OPENAI_API_KEY 以 sk- 开头且是普通 API key,Codex CLI 完全绕开订阅档位上限。按 token 走 API 定价表,无周消息上限,只受你在控制台设置的支出上限约束。这是应对周限额触顶最干净的方案,下面给出具体数学。
为什么一次 agent 循环就能打空一整周
Codex 周限额不直观的点在于:它不和 /status 看到的消息数成线性关系。OpenAI 的 Codex 定价文档 给出了 credit 的底层算法:
- GPT-5.5 每 1M 输入 token 消耗 125 credit、缓存 12.50、每 1M 输出 750
- GPT-5.4 是 62.50 / 6.25 / 375
- GPT-5.4 mini 是 18.75 / 1.875 / 113
一次 GPT-5.5 的 agent 循环读 30 个文件(约 25 万输入 token)、产出 2.5 万 token 的方案/diff,大约消耗:
输入: 250,000 × 125/1M = 31.25 credit
输出: 25,000 × 750/1M = 18.75 credit
合计: ≈ 50 credit / 次
Plus 套餐的周 GPT-5.5 预算视平台总负载浮动,平均落在 250-300 credit 区间。六次这样的 agent 循环就能掏空整周 —— 而 /status 的 5 小时盘可能还显示 40%+ 剩余,因为 5 小时窗口按消息算,不按 credit。这就解释了 #19215 里用户看到的反差:5 小时还剩很多,周窗口已耗尽。
结构性修复是:重型 agent 循环走 API key(按美元结算,没有 credit 记账),订阅留给交互式对话。
「You’ve Hit Your Usage Limit」修复方案(覆盖每个档位)
下面 7 种方案按破坏性从小到大排列。挑第一个匹配你处境的方案,看完就停。
方案 #1 — 等 5 小时滚动重置(Free / Plus,轻度用量)
如果 /status 显示 5 小时窗口剩余 <5%、但周窗口在 30% 以上,等就行。精确的重置时间戳在 /status 里 —— 通常在你最后一次突发用量后 3-5 小时内。
等的过程里,有产出的做法是把 IDE 切到手动编码模式,或用一个不共享这套限额的非 Codex 工具(任何 IDE 端自动补全都行)。
方案 #2 — 领取免费重置(2026 年 6 月 11 日 changelog)
2026 年 6 月 11 日的 Codex changelog 引入了「rate-limit reset banking」,在功能上线时给 Plus 和 Pro 用户各发一次免费重置。如果你还没领,触顶时 Codex CLI 会显示选项;CLI ≥ v0.135 也支持 codex /reset 命令。
每次发布事件每用户一次。如果 OpenAI 又发了一次重置(5 月 15 日 Tibo 在 X 上宣布的那次是团队级,不消耗 banking 的那一次),先看 changelog 公告再决定要不要烧掉手上唯一一次 banking 重置。
方案 #3 — 升级套餐档位
如果你每周都在打空 Plus 的周限额,Pro 5x($100)给到 5 倍消息预算,Pro 20x($200)给 20 倍。和走 API 路径的盈亏平衡点大致是:
| 路径 | 月费 | 能得到什么 | API 平衡点 |
|---|---|---|---|
| Plus | $20 | 15-80 GPT-5.5 msgs/5h | 每周 3-5 次重型会话 |
| Pro 5x | $100 | 75-400 GPT-5.5 msgs/5h | 每月 100 次轻或 25-30 次重 |
| Pro 20x | $200 | 300-1,600 GPT-5.5 msgs/5h | 每月 80 次重 |
| API key(直连) | $0 + 用量 | 按 token 付费,无上限 | 用量线性 |
| API key(ofox,旗舰打 85 折) | $0 + 用量 | 按 token 付费,无上限 | 每次重型会话约 $0.80 |
如果你的用量模式是「偶尔爆发式重型工作」,API 路径几乎稳赢。订阅只有在用量稳定可预测时才划算。
方案 #4 — 幻象限额绕开方法(issue #19215)
如果 /status 显示容量正常但 Codex 仍然以 usage limit 拒绝请求,你撞上了 #19215。这个 bug 在 Codex CLI v0.124.0 出现(issue 提交时仍未修复)。可行步骤:
codex /quit
rm -rf ~/.codex/sessions/*
codex
清掉本地会话缓存可以解决多数报告案例。如果仍未解决,把日志发到 issue 帖里反馈,并切到方案 #5(API key 路径)保持工作不中断。
方案 #5 — 把 OPENAI_BASE_URL 切到 OpenAI 直连 API 端点
最干净的「我只想继续写代码」方案。在 platform.openai.com/api-keys 生成一个 OpenAI API key(sk- 开头那种,不是 sk-proj- 的 ChatGPT 绑定 key),然后:
export OPENAI_API_KEY=sk-your-api-key
export OPENAI_BASE_URL=https://api.openai.com/v1
codex
Codex 此时打的是按 token 计费的 API,而不是你的 ChatGPT 订阅。成本按 token 算。一次小 bug 修复在 GPT-5.5 上大约 $0.40,多文件重构(约 30 万输入 / 3 万输出)大约 $2.40 —— 都远低于一次「需要付费」的 banking 重置。
权衡:你会失去 ChatGPT 捆绑的云端功能(Slack 集成、Codex dashboard 里的 GitHub 评审)。如果只做纯 CLI 工作,这是最高杠杆的方案。
方案 #6 — 把 OPENAI_BASE_URL 切到兼容 OpenAI 的按量 API
和方案 #5 同形态,区别在于走的是聚合多模型、统一 key、暴露每 key 预算的供应商。下面例子用 ofox,但这套模式适用于任何兼容 OpenAI 的端点。
export OPENAI_API_KEY=ofox-your-key-here
export OPENAI_BASE_URL=https://api.ofox.ai/v1
codex
ChatGPT 订阅已打空时,这条路相比直连 OpenAI 有三点优势:
- 旗舰模型更便宜。ofox 上
openai/gpt-5.3-codex是输入 $1.49 / 输出 $11.90 每百万 token,相比 OpenAI 官方 $1.75 / $14.00 打 85 折。OpenAI 直连 $0.95 的同款重构在这里约 $0.80。 - 模型可无缝切换。ofox 上
openai/gpt-5.4-mini是输入 $0.638 / 输出 $3.83 每百万 token,便宜到可以当作迭代工作的默认模型,把 gpt-5.3-codex 留给硬重构。 - 每 key 预算。ofox 在 dashboard 上暴露每个 key 的月度上限。设成 $50/月,不管 agent 循环跑得多猛都不会超。
ofox Codex 集成文档 和深度版的 Codex CLI 自定义端点指南 涵盖了模型级调优。
方案 #7 — 通过 ~/.codex/config.toml 做多供应商路由
如果你的团队或个人想让 gpt-5.3-codex 跑硬重构、便宜模型跑迭代,配置两个供应商让 Codex 切换:
[model_providers.ofox]
name = "OfoxAI"
base_url = "https://api.ofox.ai/v1"
wire_api = "responses"
[model_providers.openai_direct]
name = "OpenAI Direct"
base_url = "https://api.openai.com/v1"
wire_api = "responses"
[profiles.fast]
model = "openai/gpt-5.4-mini"
model_provider = "ofox"
[profiles.heavy]
model = "openai/gpt-5.3-codex"
model_provider = "ofox"
按需切换:硬活用 codex --profile heavy,迭代用 codex --profile fast。完整 schema 见 Codex CLI config.toml 深度解析。
Codex 限额事件:2026 年的真实节奏
今年和周限额相关的事件时间线。盯节奏是预判下一次的唯一办法。
| 日期 | 事件 | 来源 | 影响 |
|---|---|---|---|
| 2026 年 4 月 23 日 | #19215 提交 —— /status 显示容量正常但 Codex CLI 以「usage limit」拒绝;GPT-5.5、Business 套餐、CLI v0.124.0 | openai/codex#19215 | 影响 CLI v0.124.0 用户中的未知比例;解法是清本地缓存 |
| 2026 年 4 月下旬 | Codex 周活达到 300 万;OpenAI 宣布团队级 rate-limit 重置 | Knightli 复盘 | 一次性重置 |
| 2026 年 5 月 15 日 | Tibo(OpenAI)在 X 发文:持续监控中,当晚发出手动重置 | 同 Knightli 复盘 | 应激式重置,未永久提高上限 |
| 2026 年 6 月 11 日 | changelog 新增「rate-limit reset banking」—— 每用户一次免费重置 | Codex changelog | 首个用户自助的重置机制;一次性 |
| 2026 年 6 月 4 日 | Bedrock 模型支持 —— Codex 可走 Amazon 托管的配额 | Codex changelog | 间接缓解:用 Bedrock 端配额,而非 ChatGPT 档位 |
规律很清楚:OpenAI 给的是战术性重置而不是永久性提高上限。一个月内打满两次的 Plus 和 Pro 用户应该开始为 API 路径做准备,不要再赌第三次重置。
限额不会自己回来时:现在就能用的按量 API 替代方案
如果你等不起,按切换成本排序的几个选项如下。先看核心对比:
| 供应商 | base_url | gpt-5.3-codex 输入 $/M | gpt-5.3-codex 输出 $/M | 每 key 预算 | 切换耗时 |
|---|---|---|---|---|---|
| ofox | https://api.ofox.ai/v1 | $1.49 | $11.90 | 支持(dashboard) | 约 60s(2 个环境变量) |
| OpenAI 直连 | https://api.openai.com/v1 | $1.75 | $14.00 | 仅账户级 | 约 60s(2 个环境变量) |
| Amazon Bedrock | (Bedrock 代理) | 视区域 | 视区域 | AWS 账户级上限 | 10-30 分钟(IAM + 区域) |
| 换编码工具 | 不适用(例如 Claude Code) | 不适用 —— 不同模型 | 不适用 | 视供应商 | 数小时(重写工作流) |
来源:定价在 2026 年 6 月 15 日核对 ofox 模型目录 和 Codex 定价文档。
方案 A — ofox(兼容 OpenAI 的替换)
优点:旗舰 OpenAI 模型打 85 折,每 key 支出上限,若同时用 Claude/Gemini 还能合并账单,Codex CLI 是官方支持的客户端。
怎么切:两个环境变量。OPENAI_BASE_URL=https://api.ofox.ai/v1,OPENAI_API_KEY 设成 ofox key。重启 Codex。总耗时不到 60 秒。
API 模型 ID:openai/gpt-5.3-codex、openai/gpt-5.5、openai/gpt-5.4、openai/gpt-5.4-mini。完整目录见 ofox 模型目录。
方案 B — OpenAI 直连 API
优点:和 ChatGPT 套餐同一家,不存在第三方信任问题,模型阵容完整。
缺点:官方定价(没有折扣),没有脚本支持就没有每 key 预算。
怎么切:在 platform.openai.com/api-keys 拿一个 sk- API key,OPENAI_BASE_URL=https://api.openai.com/v1。重启 Codex。
方案 C — Amazon Bedrock(2026 年 6 月 4 日上线)
优点:配额走你的 AWS 账户,本身已经付 AWS 的账时合适。
缺点:模型目录仅限 AWS(当前是 OpenAI 的一个子集),区域可用性受限,鉴权比环境变量复杂。
怎么切:配置 Bedrock 凭证,OPENAI_BASE_URL 指向 Bedrock 代理端点。具体步骤看 changelog。
方案 D — 直接换编码工具
如果 Codex CLI 周限额一直在咬你,也可以转 Claude Code(用 claude-opus-4-8,2026 年 6 月在 Anthropic 当前的旗舰,并已在 ofox marketplace 上线)或其他编码 agent。摩擦在配置重写 —— 你的 Codex AGENTS.md、提示词、harness 习惯不能干净迁移。这条路留给「我决定不再用 Codex」,不是「我今天得交活」。
工作流迁移的具体差异可看 Codex 真实编码工作流。
怎么监控 Codex 状态、给未来烧钱设上限
止血之后,给自己安一套防再次撞墙的机制。
每次重活前都 /status 一下
把它做成反射动作。任何超过 10 万输入 token 的任务都先 /status。如果有一个窗口剩余低于 30%,本次会话直接切到 API key 鉴权。
订阅 OpenAI 状态页
status.openai.com 近实时显示 API 故障和 Codex 降级。订阅邮件或 RSS —— Codex 出问题时你想第一时间知道,而不是先花 10 分钟怀疑自己配置坏了。
跟踪 Codex CLI 版本号
幻象限额 bug(#19215)绑定 CLI v0.124.0。固定到一个已知良好版本:
npm install -g @openai/codex@0.135.0
用 codex --version 查当前版本。新版本起码用一周,让回归 bug 暴露出来再升级。
走 API 鉴权时设每 key 支出上限
切到按量 API 后(方案 #5/#6),设一个硬上限。OpenAI 直连在 dashboard「Spend limits」里,ofox 在 keys 页面的每 key 月度上限。单开发者的合理起步上限:$50/月。看完一个月真实烧钱再调。
用 10 行 shell hook 看每日支出
比起等 dashboard 告警,更务实的做法是本地记每次 Codex 会话的 token 数,再累加日总。把下面这段丢到 ~/.codex/hooks/post-session.sh:
#!/bin/bash
# 把每次会话的 token 数追加到 ~/.codex/spend.log
LOG=~/.codex/spend.log
TS=$(date -u +%Y-%m-%dT%H:%M:%SZ)
echo "$TS in=$CODEX_INPUT_TOKENS out=$CODEX_OUTPUT_TOKENS model=$CODEX_MODEL" >> "$LOG"
读今日总量:
grep "^$(date -u +%Y-%m-%d)" ~/.codex/spend.log | \
awk '{for(i=1;i<=NF;i++){if($i~/^in=/){gsub("in=","",$i);ins+=$i};if($i~/^out=/){gsub("out=","",$i);outs+=$i}}} \
END{printf "today: %d input / %d output tokens\n", ins, outs}'
得不到精确到美元的账单(模型价位会让换算复杂),但你能在下一次开 agent 循环之前看到「今天已经烧了 80 万 token」。仅这一个行为提示,实践中通常让周烧量下降 20-30%。
默认用便宜模型
迭代工作最便宜可靠的模型是 ofox 上的 openai/gpt-5.4-mini,输入 $0.638/百万 token。把它设成 Codex CLI 默认模型,只在确实需要旗舰编码能力时切到 gpt-5.3-codex。这种模式跑一周通常能砍掉一半支出。
更宽的模式可见 自定义模型供应商 BYO 配置指南。
团队共享配置(多人开发场景)
如果团队里 3 人以上都在打满同一个周限额,个人 ChatGPT 订阅已经不是合适的形状。经济账翻转:
- 5 个开发者 × $20 Plus = $100/月,但限额各自计算且不可预测
- 5 个开发者 × 共享 API key + $50/月上限 = 可预测的 $250/月封顶,用量池化
ofox 大多数客户用的团队共享模式是按环境(dev、staging、ci)一个 API key,而不是按开发者。config.toml 放仓库里,环境变量从每个开发者的密钥管理器拿。可以提交到仓库的示例:
# .codex/config.toml — 提交到仓库
[model_providers.team]
name = "Team Shared (ofox)"
base_url = "https://api.ofox.ai/v1"
wire_api = "responses"
# 鉴权走每个开发者的 $OPENAI_API_KEY(开发者本地环境,不进仓库)
[profiles.default]
model = "openai/gpt-5.4-mini"
model_provider = "team"
[profiles.heavy]
model = "openai/gpt-5.3-codex"
model_provider = "team"
每个开发者本地设自己的 OPENAI_API_KEY(指向密钥管理器里的每人或每团队 key)。支出监控集中到一块 ofox dashboard,而不是五个独立的 ChatGPT 账号。CI 管道用单独一个 key,每次跑配更严格的上限。
相对个人 ChatGPT 订阅的差别:一个开发者跑了一次 $4 token 成本的重构,整个团队在一个 dashboard 上看得见。五个独立 ChatGPT 订阅同一周各自打满周限额时,你既没有可见性也没有共享预算。
关于真实性和成本的一段话
把 Codex CLI 从 $20 ChatGPT 套餐切到兼容 OpenAI 的 API 上跑,gpt-5.3-codex 上一次小 bug 修复成本约 $0.13 —— 比订阅在某个糟糕下午被幻象限额浪费掉的额度还少。
这就是真实的算术。ChatGPT 订阅在用量稳定、在上限以内时是好东西。一旦用量变成爆发形状 —— 重构周、CI 死线、单次 agent 循环触碰 30 个文件 —— 订阅上限就是错误的抽象。Token 计费按实际用量付费,让你能继续交活。
本轮更新核对过的来源
- OpenAI Codex rate card —— 档位消息上限,2026 年 6 月 15 日核对
- Codex 定价文档 —— 按 token 的 API 定价和 credit 算法,2026 年 6 月 15 日核对
- Codex changelog —— rate-limit reset banking(2026 年 6 月 11 日)、Bedrock 支持(2026 年 6 月 4 日),2026 年 6 月 15 日核对
- openai/codex#19215 —— CLI v0.124.0 的幻象限额 bug,2026 年 6 月 15 日核对
- Knightli 重置历史 —— 2026 年 4 月 / 5 月的重置事件
- ofox 模型目录 ——
openai/gpt-5.3-codex、openai/gpt-5.5、openai/gpt-5.4-mini的按 token 定价,2026 年 6 月 15 日核对 - ofox Codex 集成文档 ——
OPENAI_BASE_URL替换式配置 - Codex CLI 自定义端点指南(ofox blog) ——
OPENAI_BASE_URL机制的内部参考 - Codex config.toml 深度解析(ofox blog) —— 多供应商 profile schema
- Codex CLI 真实编码工作流(ofox blog) —— 重型重构会话的工作流背景


