Codex 周限额为什么比预期更早被打空？

两个原因。第一，/status 把 5 小时窗口和周窗口分开显示，但一次长 agent 会话可能同时打爆两个 —— openai/codex 仓库的 #19215 issue（2026 年 4 月 23 日提交）就记录了用户在 5 小时剩 78%、周剩 68% 的情况下被拒绝。第二，GPT-5.5 每 1M 输入 token 消耗 125 credit、每 1M 输出消耗 750 credit，所以一次大型重构就足以让 Plus 的 15-80 条/5 小时配额掏空整周。

怎么知道 Codex 周限额什么时候重置？

在 Codex CLI 里运行 /status 会显示精确的重置时间戳。OpenAI 偶尔也会做团队级重置 —— Tibo（OpenAI）确认过 2026 年 5 月 15 日的手动重置；2026 年 6 月 11 日的 changelog 又新增了 rate-limit reset banking，给 Plus 和 Pro 用户在功能上线时各发了一次免费重置。

ChatGPT API 的限额和 Plus/Pro 的 Codex 用量是分开的吗？

是分开的。ChatGPT Plus、Pro、Business、Enterprise 订阅会强制执行 5 小时和周消息上限。API key（sk-... 开头）按 token 计费，没有消息上限，只受你在 OpenAI 控制台设置的支出上限约束。Codex CLI 两种鉴权方式都能用。

周限额触顶后还能继续用 Codex CLI 吗？

能。把 OPENAI_API_KEY 切换成按 token 计费的 API key，OPENAI_BASE_URL 指向 OpenAI 官方端点或兼容 OpenAI 的供应商（例如 https://api.ofox.io/v1），Codex 会无需重启切换传输层。

GPT-5.3-Codex 每百万 token 多少钱？

OpenAI 官方：输入 $1.75、缓存输入 $0.175、输出 $14.00/百万 token。通过 ofox 调用同款 openai/gpt-5.3-codex：输入 $1.49、输出 $11.90，比 OpenAI 旗舰模型便宜约 15%。

如果总是打满限额，Plus 和 Pro 哪个更划算？

如果 $20 Plus 的周限额 2-3 次硬重构就会打满，按 token 计费的 API 更值。典型多文件重构（30 万输入 / 3 万输出）在 OpenAI 官方价是 $0.95，ofox 是 $0.80 —— 单次成本不到 $1。Pro 5x 月费 $100 只有在你每月跑 100 次以上重型会话才划算。

把 Codex CLI 切到别的供应商，OpenAI 账号会被标记吗？

不会。OPENAI_BASE_URL 是 OpenAI 开发者文档里明确写出的官方 Codex CLI 配置项。从 2026 年 2 月起，Codex CLI 只说 OpenAI Responses API（Chat Completions 已被移除 —— 参见 openai/codex#7782 以及下游 janhq/jan、cc-switch、CLIProxyAPI 的连锁中断），所以供应商必须暴露 /v1/responses，并在 ~/.codex/config.toml 里配置 wire_api = "responses"。

今后怎么稳妥地给 Codex 支出设上限？

在 OpenAI 控制台设置每月硬支出上限，或者用支持每 key 预算的供应商。每次 100k+ token 操作前先 /status 检查，把默认模型保持在 gpt-5.4-mini（ofox 上输入 $0.638/百万 token），只在复杂重构时切到 gpt-5.3-codex。

Codex 周限额耗尽怎么办：7 种修复方案、限额机制和替代 API（2026）

TL;DR

$20 Plus 套餐的 Codex 周限额，被一次长重构就可以在三小时内打空；OpenAI 唯一一次团队级重置发生在 2026 年 6 月 11 日。

限额触顶后你有两条路：等待滚动重置（Plus 每 5 小时滚一次，周限额按周重置），或者把 Codex CLI 的 OPENAI_BASE_URL 切到按 token 计费的 API。本文给你 30 秒诊断方法、Plus 和 Pro 的精确数学题，以及 7 种从「今天还能继续用 ChatGPT」到「60 秒切到按量 API」的具体修复方案。

Codex 挂了，还是你的周限额被打空？30 秒诊断

在切换供应商之前，先确认是哪个窗口爆了。在任何打开的 Codex CLI 会话里跑：

codex /status

输出会显示三个数字。对照下表：

诊断	上下文窗口	5 小时窗口	周窗口	处理方式
周限额触顶	任意	>10%	<5%	套餐层面问题 —— 升级或切 API key
5 小时限额触顶	任意	<5%	>20%	等下一次 5 小时滚动（最多 5h）
上下文溢出	<5%	>20%	>20%	压缩会话或拆任务
幻象限额（issue #19215）	>40%	>50%	>50%	重启 Codex CLI；若仍报错，切 base_url

如果 /status 显示容量正常但仍然看到 You've hit your usage limit. To get more access now, send a request to your admin or try again at 3:51 PM，那就是 #19215 幻象限额 bug（2026 年 4 月 23 日在 Codex CLI v0.124.0 上报告）。直接跳到方案 #4。

常见 Codex 报错文案 → 原因 → 修复

Codex 打印出的字面文案是分诊最快的依据，对应到下表：

报错文案（原文）	可能原因	对应方案
`You've hit your usage limit. ... try again at HH:MM PM`	真实的 5 小时或周限额	方案 #1（等）或 #5/#6（API 路径）
`You've hit your usage limit`，但 `/status` 显示剩余 >50%	CLI v0.124.0 的幻象限额 bug（#19215）	方案 #4（清 sessions 缓存）
CLI 提示里出现 `request a free reset` 按钮	还能领取免费重置（6 月 11 日之后）	方案 #2（领取免费重置）
API 模式下 HTTP 报 `429 Too Many Requests`	直连 API 突发流量限流	回退重试、降并发，或方案 #6（设每 key 预算）
API 模式下 HTTP 报 `insufficient_quota`	OpenAI 账户支出上限触顶	提高控制台支出上限或切 base_url
`You've reached your weekly limit`，无重置按钮	本次发布的免费重置已用	方案 #3（升级套餐）或 #5/#6（API）
`context_length_exceeded`	会话太长，不是套餐限额	`codex /compact` 或开新会话

什么时候修限额，什么时候直接切到按量 API

不是所有限额触顶都值得绕开。把你的处境对到下面的规则：

继续修现有套餐的限额。 本周第一次触顶，/status 显示是正常限额（不是幻象 bug），手上跑的任务接近收尾、不是新开一个多小时的 agent 循环。6 月 11 日的团队级 reset banking 给每个用户存了一次免费重置，你可能本来就有一次可用。

直接切到按 token 计费的 API。 每个月超过两次打满周限额，agent 工作流单次会话动辄 30 万+ 输入 token，需要每个任务有可预估的成本（比如给客户报价），或者在 CI 和共享开发环境里 —— 分层 ChatGPT 鉴权本来就不适合。

停止规则。 如果 /status 显示剩余容量充足、当天只触顶一次，什么都别做。5 小时滚动窗口会自动恢复，为一次偶发问题切换供应商是过度工程。关掉这个 tab 写代码去。

解读 Codex 限额：套餐、窗口、各档实际能给到什么

Codex CLI 继承的是当前鉴权路径的限额。三个订阅档位和 API 路径各有不同的上限。

订阅档位的 5 小时消息上限

ChatGPT 订阅档位通过滚动 5 小时窗口里的消息数对 Codex 使用做限流，而不是 token。公布的区间很宽，因为每条「消息」会按模型和任务复杂度加权。

套餐	月费	GPT-5.5 消息/5h	GPT-5.4 消息/5h	GPT-5.3-Codex 消息/5h
Free	$0	无（用 Codex 至少需要 Plus）	无	无
Plus	$20	15-80	20-100	45-225
Pro 5x	$100	75-400	100-500	225-1,125
Pro 20x	$200	300-1,600	400-2,000	900-4,500
Business	按席位	视席位分配	—	—

来源：OpenAI Codex rate card 和 Codex 定价文档，数据在 2026 年 6 月 15 日核对。Plus（15-80）和 Pro 20x（300-1,600）有第三方社区报告佐证；Pro 5x 的 75-400 区间目前只来自官方 rate card，撰稿时尚无第三方交叉验证。

宽区间（如「15-80」）反映 OpenAI 会根据平台总负载和个人使用模式动态调整上限。区间下限就是繁忙时段你能实际拿到的数。

周限额机制

周限额叠加在 5 小时窗口之上。周限额从你本周第一条消息开始，以 7 天滚动重置。两个窗口独立计算 —— 数学问题就在这里。

GPT-5.5 上一次多文件 agent 循环（输入重型：约 25 万 token / 输出约 2.5 万）在 5 小时口径上大约等价 30-40 条消息，但在周窗口上算一次「会话」。Plus 用户连跑 2-3 次重型重构就足以打空周限额，而 5 小时计量盘可能还显示 30%+ 剩余。

API key 路径（无消息上限）

如果 OPENAI_API_KEY 以 sk- 开头且是普通 API key，Codex CLI 完全绕开订阅档位上限。按 token 走 API 定价表，无周消息上限，只受你在控制台设置的支出上限约束。这是应对周限额触顶最干净的方案，下面给出具体数学。

为什么一次 agent 循环就能打空一整周

Codex 周限额不直观的点在于：它不和 /status 看到的消息数成线性关系。OpenAI 的 Codex 定价文档给出了 credit 的底层算法：

GPT-5.5 每 1M 输入 token 消耗 125 credit、缓存 12.50、每 1M 输出 750
GPT-5.4 是 62.50 / 6.25 / 375
GPT-5.4 mini 是 18.75 / 1.875 / 113

一次 GPT-5.5 的 agent 循环读 30 个文件（约 25 万输入 token）、产出 2.5 万 token 的方案/diff，大约消耗：

输入:  250,000 × 125/1M = 31.25 credit
输出:  25,000  × 750/1M = 18.75 credit
合计:                     ≈ 50 credit / 次

Plus 套餐的周 GPT-5.5 预算视平台总负载浮动，平均落在 250-300 credit 区间。六次这样的 agent 循环就能掏空整周 —— 而 /status 的 5 小时盘可能还显示 40%+ 剩余，因为 5 小时窗口按消息算，不按 credit。这就解释了 #19215 里用户看到的反差：5 小时还剩很多，周窗口已耗尽。

结构性修复是：重型 agent 循环走 API key（按美元结算，没有 credit 记账），订阅留给交互式对话。

「You’ve Hit Your Usage Limit」修复方案（覆盖每个档位）

下面 7 种方案按破坏性从小到大排列。挑第一个匹配你处境的方案，看完就停。

方案 #1 — 等 5 小时滚动重置（Free / Plus，轻度用量）

如果 /status 显示 5 小时窗口剩余 <5%、但周窗口在 30% 以上，等就行。精确的重置时间戳在 /status 里 —— 通常在你最后一次突发用量后 3-5 小时内。

等的过程里，有产出的做法是把 IDE 切到手动编码模式，或用一个不共享这套限额的非 Codex 工具（任何 IDE 端自动补全都行）。

方案 #2 — 领取免费重置（2026 年 6 月 11 日 changelog）

2026 年 6 月 11 日的 Codex changelog 引入了「rate-limit reset banking」，在功能上线时给 Plus 和 Pro 用户各发一次免费重置。如果你还没领，触顶时 Codex CLI 会显示选项；CLI ≥ v0.135 也支持 codex /reset 命令。

每次发布事件每用户一次。如果 OpenAI 又发了一次重置（5 月 15 日 Tibo 在 X 上宣布的那次是团队级，不消耗 banking 的那一次），先看 changelog 公告再决定要不要烧掉手上唯一一次 banking 重置。

方案 #3 — 升级套餐档位

如果你每周都在打空 Plus 的周限额，Pro 5x（$100）给到 5 倍消息预算，Pro 20x（$200）给 20 倍。和走 API 路径的盈亏平衡点大致是：

路径	月费	能得到什么	API 平衡点
Plus	$20	15-80 GPT-5.5 msgs/5h	每周 3-5 次重型会话
Pro 5x	$100	75-400 GPT-5.5 msgs/5h	每月 100 次轻或 25-30 次重
Pro 20x	$200	300-1,600 GPT-5.5 msgs/5h	每月 80 次重
API key（直连）	$0 + 用量	按 token 付费，无上限	用量线性
API key（ofox，旗舰打 85 折）	$0 + 用量	按 token 付费，无上限	每次重型会话约 $0.80

如果你的用量模式是「偶尔爆发式重型工作」，API 路径几乎稳赢。订阅只有在用量稳定可预测时才划算。

方案 #4 — 幻象限额绕开方法（issue #19215）

如果 /status 显示容量正常但 Codex 仍然以 usage limit 拒绝请求，你撞上了 #19215。这个 bug 在 Codex CLI v0.124.0 出现（issue 提交时仍未修复）。可行步骤：

codex /quit
rm -rf ~/.codex/sessions/*
codex

清掉本地会话缓存可以解决多数报告案例。如果仍未解决，把日志发到 issue 帖里反馈，并切到方案 #5（API key 路径）保持工作不中断。

方案 #5 — 把 `OPENAI_BASE_URL` 切到 OpenAI 直连 API 端点

最干净的「我只想继续写代码」方案。在 platform.openai.com/api-keys 生成一个 OpenAI API key（sk- 开头那种，不是 sk-proj- 的 ChatGPT 绑定 key），然后：

export OPENAI_API_KEY=sk-your-api-key
export OPENAI_BASE_URL=https://api.openai.com/v1
codex

Codex 此时打的是按 token 计费的 API，而不是你的 ChatGPT 订阅。成本按 token 算。一次小 bug 修复在 GPT-5.5 上大约 $0.40，多文件重构（约 30 万输入 / 3 万输出）大约 $2.40 —— 都远低于一次「需要付费」的 banking 重置。

权衡：你会失去 ChatGPT 捆绑的云端功能（Slack 集成、Codex dashboard 里的 GitHub 评审）。如果只做纯 CLI 工作，这是最高杠杆的方案。

方案 #6 — 把 `OPENAI_BASE_URL` 切到兼容 OpenAI 的按量 API

和方案 #5 同形态，区别在于走的是聚合多模型、统一 key、暴露每 key 预算的供应商。下面例子用 ofox，但这套模式适用于任何兼容 OpenAI 的端点。

export OPENAI_API_KEY=ofox-your-key-here
export OPENAI_BASE_URL=https://api.ofox.io/v1
codex

ChatGPT 订阅已打空时，这条路相比直连 OpenAI 有三点优势：

旗舰模型更便宜。ofox 上 openai/gpt-5.3-codex 是输入 $1.49 / 输出 $11.90 每百万 token，相比 OpenAI 官方 $1.75 / $14.00 打 85 折。OpenAI 直连 $0.95 的同款重构在这里约 $0.80。
模型可无缝切换。ofox 上 openai/gpt-5.4-mini 是输入 $0.638 / 输出 $3.83 每百万 token，便宜到可以当作迭代工作的默认模型，把 gpt-5.3-codex 留给硬重构。
每 key 预算。ofox 在 dashboard 上暴露每个 key 的月度上限。设成 $50/月，不管 agent 循环跑得多猛都不会超。

ofox Codex 集成文档和深度版的 Codex CLI 自定义端点指南涵盖了模型级调优。

方案 #7 — 通过 `~/.codex/config.toml` 做多供应商路由

如果你的团队或个人想让 gpt-5.3-codex 跑硬重构、便宜模型跑迭代，配置两个供应商让 Codex 切换：

[model_providers.ofox]
name = "OfoxAI"
base_url = "https://api.ofox.io/v1"
wire_api = "responses"

[model_providers.openai_direct]
name = "OpenAI Direct"
base_url = "https://api.openai.com/v1"
wire_api = "responses"

[profiles.fast]
model = "openai/gpt-5.4-mini"
model_provider = "ofox"

[profiles.heavy]
model = "openai/gpt-5.3-codex"
model_provider = "ofox"

按需切换：硬活用 codex --profile heavy，迭代用 codex --profile fast。完整 schema 见 Codex CLI config.toml 深度解析。

Codex 限额事件：2026 年的真实节奏

今年和周限额相关的事件时间线。盯节奏是预判下一次的唯一办法。

日期	事件	来源	影响
2026 年 4 月 23 日	#19215 提交 —— `/status` 显示容量正常但 Codex CLI 以「usage limit」拒绝；GPT-5.5、Business 套餐、CLI v0.124.0	openai/codex#19215	影响 CLI v0.124.0 用户中的未知比例；解法是清本地缓存
2026 年 4 月下旬	Codex 周活达到 300 万；OpenAI 宣布团队级 rate-limit 重置	Knightli 复盘	一次性重置
2026 年 5 月 15 日	Tibo（OpenAI）在 X 发文：持续监控中，当晚发出手动重置	同 Knightli 复盘	应激式重置，未永久提高上限
2026 年 6 月 11 日	changelog 新增「rate-limit reset banking」—— 每用户一次免费重置	Codex changelog	首个用户自助的重置机制；一次性
2026 年 6 月 4 日	Bedrock 模型支持 —— Codex 可走 Amazon 托管的配额	Codex changelog	间接缓解：用 Bedrock 端配额，而非 ChatGPT 档位

规律很清楚：OpenAI 给的是战术性重置而不是永久性提高上限。一个月内打满两次的 Plus 和 Pro 用户应该开始为 API 路径做准备，不要再赌第三次重置。

限额不会自己回来时：现在就能用的按量 API 替代方案

如果你等不起，按切换成本排序的几个选项如下。先看核心对比：

供应商	base_url	gpt-5.3-codex 输入 $/M	gpt-5.3-codex 输出 $/M	每 key 预算	切换耗时
ofox	`https://api.ofox.io/v1`	$1.49	$11.90	支持（dashboard）	约 60s（2 个环境变量）
OpenAI 直连	`https://api.openai.com/v1`	$1.75	$14.00	仅账户级	约 60s（2 个环境变量）
Amazon Bedrock	（Bedrock 代理）	视区域	视区域	AWS 账户级上限	10-30 分钟（IAM + 区域）
换编码工具	不适用（例如 Claude Code）	不适用 —— 不同模型	不适用	视供应商	数小时（重写工作流）

来源：定价在 2026 年 6 月 15 日核对 ofox 模型目录和 Codex 定价文档。

方案 A — ofox（兼容 OpenAI 的替换）

优点：旗舰 OpenAI 模型打 85 折，每 key 支出上限，若同时用 Claude/Gemini 还能合并账单，Codex CLI 是官方支持的客户端。

怎么切：两个环境变量。OPENAI_BASE_URL=https://api.ofox.io/v1，OPENAI_API_KEY 设成 ofox key。重启 Codex。总耗时不到 60 秒。

API 模型 ID：openai/gpt-5.3-codex、openai/gpt-5.5、openai/gpt-5.4、openai/gpt-5.4-mini。完整目录见 ofox 模型目录。

方案 B — OpenAI 直连 API

优点：和 ChatGPT 套餐同一家，不存在第三方信任问题，模型阵容完整。

缺点：官方定价（没有折扣），没有脚本支持就没有每 key 预算。

怎么切：在 platform.openai.com/api-keys 拿一个 sk- API key，OPENAI_BASE_URL=https://api.openai.com/v1。重启 Codex。

方案 C — Amazon Bedrock（2026 年 6 月 4 日上线）

优点：配额走你的 AWS 账户，本身已经付 AWS 的账时合适。

缺点：模型目录仅限 AWS（当前是 OpenAI 的一个子集），区域可用性受限，鉴权比环境变量复杂。

怎么切：配置 Bedrock 凭证，OPENAI_BASE_URL 指向 Bedrock 代理端点。具体步骤看 changelog。

方案 D — 直接换编码工具

如果 Codex CLI 周限额一直在咬你，也可以转 Claude Code（用 claude-opus-4-8，2026 年 6 月在 Anthropic 当前的旗舰，并已在 ofox marketplace 上线）或其他编码 agent。摩擦在配置重写 —— 你的 Codex AGENTS.md、提示词、harness 习惯不能干净迁移。这条路留给「我决定不再用 Codex」，不是「我今天得交活」。

工作流迁移的具体差异可看 Codex 真实编码工作流。

怎么监控 Codex 状态、给未来烧钱设上限

止血之后，给自己安一套防再次撞墙的机制。

每次重活前都 `/status` 一下

把它做成反射动作。任何超过 10 万输入 token 的任务都先 /status。如果有一个窗口剩余低于 30%，本次会话直接切到 API key 鉴权。

订阅 OpenAI 状态页

status.openai.com 近实时显示 API 故障和 Codex 降级。订阅邮件或 RSS —— Codex 出问题时你想第一时间知道，而不是先花 10 分钟怀疑自己配置坏了。

跟踪 Codex CLI 版本号

幻象限额 bug（#19215）绑定 CLI v0.124.0。固定到一个已知良好版本：

npm install -g @openai/codex@0.135.0

用 codex --version 查当前版本。新版本起码用一周，让回归 bug 暴露出来再升级。

走 API 鉴权时设每 key 支出上限

切到按量 API 后（方案 #5/#6），设一个硬上限。OpenAI 直连在 dashboard「Spend limits」里，ofox 在 keys 页面的每 key 月度上限。单开发者的合理起步上限：$50/月。看完一个月真实烧钱再调。

用 10 行 shell hook 看每日支出

比起等 dashboard 告警，更务实的做法是本地记每次 Codex 会话的 token 数，再累加日总。把下面这段丢到 ~/.codex/hooks/post-session.sh：

#!/bin/bash
# 把每次会话的 token 数追加到 ~/.codex/spend.log
LOG=~/.codex/spend.log
TS=$(date -u +%Y-%m-%dT%H:%M:%SZ)
echo "$TS in=$CODEX_INPUT_TOKENS out=$CODEX_OUTPUT_TOKENS model=$CODEX_MODEL" >> "$LOG"

读今日总量：

grep "^$(date -u +%Y-%m-%d)" ~/.codex/spend.log | \
  awk '{for(i=1;i<=NF;i++){if($i~/^in=/){gsub("in=","",$i);ins+=$i};if($i~/^out=/){gsub("out=","",$i);outs+=$i}}} \
       END{printf "today: %d input / %d output tokens\n", ins, outs}'

得不到精确到美元的账单（模型价位会让换算复杂），但你能在下一次开 agent 循环之前看到「今天已经烧了 80 万 token」。仅这一个行为提示，实践中通常让周烧量下降 20-30%。

默认用便宜模型

迭代工作最便宜可靠的模型是 ofox 上的 openai/gpt-5.4-mini，输入 $0.638/百万 token。把它设成 Codex CLI 默认模型，只在确实需要旗舰编码能力时切到 gpt-5.3-codex。这种模式跑一周通常能砍掉一半支出。

更宽的模式可见自定义模型供应商 BYO 配置指南。

团队共享配置（多人开发场景）

如果团队里 3 人以上都在打满同一个周限额，个人 ChatGPT 订阅已经不是合适的形状。经济账翻转：

5 个开发者 × $20 Plus = $100/月，但限额各自计算且不可预测
5 个开发者 × 共享 API key + $50/月上限 = 可预测的 $250/月封顶，用量池化

ofox 大多数客户用的团队共享模式是按环境（dev、staging、ci）一个 API key，而不是按开发者。config.toml 放仓库里，环境变量从每个开发者的密钥管理器拿。可以提交到仓库的示例：

# .codex/config.toml — 提交到仓库
[model_providers.team]
name = "Team Shared (ofox)"
base_url = "https://api.ofox.io/v1"
wire_api = "responses"
# 鉴权走每个开发者的 $OPENAI_API_KEY（开发者本地环境，不进仓库）

[profiles.default]
model = "openai/gpt-5.4-mini"
model_provider = "team"

[profiles.heavy]
model = "openai/gpt-5.3-codex"
model_provider = "team"

每个开发者本地设自己的 OPENAI_API_KEY（指向密钥管理器里的每人或每团队 key）。支出监控集中到一块 ofox dashboard，而不是五个独立的 ChatGPT 账号。CI 管道用单独一个 key，每次跑配更严格的上限。

相对个人 ChatGPT 订阅的差别：一个开发者跑了一次 $4 token 成本的重构，整个团队在一个 dashboard 上看得见。五个独立 ChatGPT 订阅同一周各自打满周限额时，你既没有可见性也没有共享预算。

关于真实性和成本的一段话

把 Codex CLI 从 $20 ChatGPT 套餐切到兼容 OpenAI 的 API 上跑，gpt-5.3-codex 上一次小 bug 修复成本约 $0.13 —— 比订阅在某个糟糕下午被幻象限额浪费掉的额度还少。

这就是真实的算术。ChatGPT 订阅在用量稳定、在上限以内时是好东西。一旦用量变成爆发形状 —— 重构周、CI 死线、单次 agent 循环触碰 30 个文件 —— 订阅上限就是错误的抽象。Token 计费按实际用量付费，让你能继续交活。