Codex недельный лимит: 5 способов и API drop-in с потолком (2026)
17 мая 2026 пользователь Plus смотрел, как недельный счётчик Codex падает с 96% до 0% за один день — а представитель OpenAI, признавший инцидент, всё равно не мог обещать сброс счётчика до естественного недельного окна. Если ваш недельный потолок умирает дважды в месяц, правильный шаг в 2026 — не обновлять /status, а направить Codex CLI на эндпоинт с поминутной оплатой и зафиксировать потолок расходов на кошельке, а не в календаре.
Эта статья проходит конкретный путь починки исчерпанного недельного потолка: drop-in API, совместимый с OpenAI Responses, настраиваемый одним блоком в ~/.codex/config.toml, плюс три паттерна удержания месячного счёта в границах. Полный справочник конфигурации (пользовательские провайдеры, заголовки, идентификаторы моделей) — в статье Настройка Codex CLI с пользовательским API-эндпоинтом.
Квота Codex действительно исчерпана? Диагностика за 30 секунд
Прежде чем что-либо менять, убедитесь, что проблема именно в счётчике, а не в ошибке соединения или модели, замаскированной под лимит.
| Симптом | Что показывает /status | Что это значит | Первый шаг |
|---|---|---|---|
| Баннер: «You’ve hit your weekly limit» | weekly: 0% remaining | Недельный потолок исчерпан, в 5-часовом ещё может быть запас | Маршрут без недельного счётчика (drop-in API) или потратьте накопленный сброс |
| Баннер: «5-hour limit reached» | 5h: 0% remaining / weekly > 0% | Только короткая пробуксовка | Подождать, переключиться на не-CLI задачи, или прогнать тот же промпт через drop-in API |
Ошибка: usage_limit_reached | weekly и 5h оба > 0% | Баг рассинхронизации счётчиков (известная проблема мая 2026) | Перезапустите CLI; если повторяется — на статус OpenAI и в drop-in fallback |
Ошибка: Unsupported wire_api | несовпадение провайдера | Пользовательский провайдер не говорит по Responses API | Сменить модель или добавить транслятор Responses |
Запустите Codex REPL командой codex и сначала введите /status. Если он говорит, что недельный счётчик ненулевой, но сессия не стартует — вы видите паттерн рассинхрона счётчиков, который Tibo из OpenAI публично признал в X в мае 2026, и переход на drop-in API быстрее, чем ожидание согласования счётчиков.
Когда применять эти решения (а когда просто подождать)
Не каждое падение оправдывает изменение конфигурации. Прогоните этот фильтр, прежде чем трогать config.toml.
Чинить сейчас (настраивать drop-in API):
- Недельный счётчик умирает чаще одного раза в календарный месяц, и вы в середине релиза.
- Упёрлись в потолок в пятницу днём, а естественный сброс наступит после конца спринта.
- Вы пользователь Plus и видите
5h: 0% remainingсразу после свежего сброса — паттерн рассинхрона мая 2026.
Подождать:
- До естественного недельного сброса меньше 24 часов, и работа не срочная.
- У вас есть накопленный сброс (по отчётам третьих сторон — у подходящих аккаунтов примерно с 12 июня 2026), и оставшаяся работа умещается в одно окно.
- Вы на Pro, и просадка потолка меньше 25% — запас по пропускной способности Pro обычно поглощает всплески одного спринта.
Правило остановки: если ваш месячный эквивалент платы за Codex (подписка + перерасход) превышает два места Pro — вам нужно постоянно сидеть на тарифицируемом API, а не прыгать между уровнями подписки. Сначала прочитайте секцию про математику цен — если арифметика решающая, остальное можно пропустить.
Понимание лимитов Codex: 5-часовой, недельный и кредиты
Codex наслаивает четыре счётчика, и сценарий поломки зависит от того, какой сработал.
| Счётчик | Область | Период сброса | Что его расходует |
|---|---|---|---|
| 5-часовое окно | сообщения CLI + облачных задач | скользящие 5 часов | всплески активных сессий, многошаговые рефакторинги |
| Недельный потолок | тот же пул, шире окно | скользящие 7 дней | устойчивая ежедневная работа, длинные автономные прогоны |
| Кредиты | зависит от плана, на стороне аккаунта | пополняется по условиям плана | расширяет недельный, когда план это поддерживает |
| Накопленный сброс | токен на стороне аккаунта | разово; пополняется через рефералов или план | одноразовая очистка счётчика |
Несколько деталей, на которые официальная документация лишь намекает:
- Урон от одного промпта: в ноябрьском треде сообщества 2025 года «single prompt eats 7% of weekly limits» пользователи Plus замеряли, что одиночные вызовы Codex CLI на отдельных вариантах модели съедают около 7% недельного потолка. Форма сохранилась и в майских инцидентах 2026 — четырнадцать таких промптов за неделю, и вы сухи.
- Только локальная работа вас не спасёт: тред «Weekly limit ran out even though I never hit the 5-hour limit» документирует расход недельного без 5-часовой активности — счётчики независимы, и недельный срабатывает по совокупному объёму.
- Кредиты — это не «кнопка пополнения»: OpenAI явно не позиционирует кредиты как универсальное пополнение потолка. Они расширяют поддерживаемые сценарии, а не каждую границу безопасности.
Полный разбор счётчиков — в How Codex Usage Limits Work.
Почему недельный потолок выгорает быстрее 5-часового
Самая контринтуитивная особенность счётчиков Codex в 2026 — удивляет вас именно недельный, а не 5-часовой. Три структурные причины:
Облачные задачи считаются иначе. Сессия Codex CLI с быстрой правкой локального файла потребляет небольшой ломтик. Тот же промпт, отправленный как облачная задача с многошаговым планированием и инструментами, может умножить недельный эквивалент без касания 5-часового потолка — потому что работа облачной задачи происходит вне скользящего локального окна, но всё равно ложится в недельный аккумулятор.
Тяжёлые по рассуждениям варианты складываются. Варианты с тюнингом под Codex, лучшие на бенчмарках рефакторинга — те, к которым тянешься в пятницу днём, когда работа критична — одновременно самые прожорливые на вызов. Один автономный прогон 30+ минут на флагмане может равняться десяткам обычных сообщений Plus в недельных бюджетах.
Счётчики согласуются асинхронно. 5-часовой отражает локальное намерение. Недельный — серверное согласование после кредитов, облачных задач и любых корректировок на стороне плана. Майский инцидент рассинхрона 2026, публично признанный OpenAI, — это видимый отказ согласования; но обычное ежедневное использование тоже показывает мелкие зазоры синхронизации, иногда складывающиеся в момент «куда делось 30% моей недели?».
Практический вывод: не бюджетируйте по 5-часовому наблюдению. Читайте недельный счётчик как реальный потолок, а 5-часовой — как ограничитель скорости на каждый всплеск. Если относиться к недельному как к плановой единице с первого дня, к среде вас уже не застанут врасплох.
Как восстановиться при исчерпании недельного лимита (по тарифам)
Free / Go
flowchart LR
A[Недельный лимит исчерпан] --> B{Есть накопленный сброс?}
B -->|Да| C[Потратить сейчас]
B -->|Нет| D{В окне рефералов<br/>11–24 июня 2026?}
D -->|Да| E[Пригласить до 3 друзей]
D -->|Нет| F[Переключить CLI на drop-in API]
C --> G[Продолжить работу]
E --> G
F --> G
У Go самый маленький недельный потолок. Бесплатный накопленный сброс, идущий с подходящими аккаунтами, — ваш ход с наибольшим рычагом; потратьте его на сессию, которую нельзя отложить.
Plus
| Ход | Когда выбирать | Усилие |
|---|---|---|
| Потратить накопленный сброс | У вас один есть, и оставшаяся работа умещается в одно недельное окно | 5 секунд |
| Активировать подходящие кредиты | На дашборде аккаунта показаны кредиты | 30 секунд |
| Переключиться на drop-in API | Падения дважды в месяц или чаще | Разовая настройка 3 минуты |
| Апгрейд до Pro | Стабильно выжигаете недельный за 3 дня после сброса | По странице планов OpenAI |
Plus — счётчик, наиболее уязвимый к майскому инциденту 2026: тред про падение с 96% до 0% за день состоит преимущественно из сообщений Plus. Если паттерн повторяется, drop-in API — не запасной, а основной маршрут.
Pro
У Pro самый большой недельный запас, но и он не иммунен. В том же майском инциденте 2026 пользователь Pro сообщил о падении лимита со 100% до 60% за час без тяжёлой работы. Путь восстановления идентичен Plus, только Pro 20x дольше держится против урона от одного промпта.
Для проверки состояния со стороны аккаунта запустите codex и введите /status, чтобы увидеть внутрисессионные 5h / weekly, и сравните с панелью использования OpenAI на platform.openai.com/usage. Внутрисессионный счётчик — клиентский взгляд; дашборд — серверное согласование. Когда они расходятся больше чем на 10 пунктов, перед вами паттерн рассинхрона, признанный Tibo из OpenAI в мае 2026: перезапустите CLI, и если разрыв сохраняется, переключайтесь на путь drop-in API ниже, не дожидаясь сведения счётчиков.
Инциденты с недельным лимитом Codex в 2026: что именно сгорело быстрее
| Дата | План | Что произошло | Источник |
|---|---|---|---|
| 28 апреля 2026 | Все платные | Плановый общий сброс лимитов | Объявление сообщества OpenAI |
| 17 мая 2026 | Plus | Пользователь afaqak: недельный с 96% до 0% за день при минимальной нагрузке | Тред сообщества #1381172 |
| 18 мая 2026 | Pro | Пользователь 3rtech: недельный со 100% до 60% за час без тяжёлой работы | Тот же тред |
| 18 мая 2026 | Plus | Пользователь Brian_Henderson: 0% остатка в 5-часовом окне после рестарта | Тот же тред |
| 20 мая 2026 | Plus | Пользователь minifi: падение изолировано на одном варианте модели Codex | Тот же тред |
| ~12 июня 2026 (по сторонним отчётам) | Go / Plus / Pro / Business | Функция накопленных сбросов начинает разворачиваться — каждый аккаунт, по сообщениям, получает 1 бесплатный сброс; официальной страницы анонса не найдено | Сводка Pasquale Pillitteri |
Паттерн: счётчики согласуются на сервере, а рассинхрон — самый частый отказ, с которым вы столкнётесь. Drop-in API убирает этот отказ целиком, потому что счётчик живёт на вашем кошельке.
Починка через drop-in API: настроить Codex CLI в 5 строк
Изменение протокола проводной коммуникации в феврале 2026 здесь принципиально. Codex CLI отказался от поддержки Chat Completions и теперь говорит только по OpenAI Responses API. Любой провайдер, на который вы его направите, должен открывать /v1/responses. Документированная интеграция ofox.ai для Codex задаёт wire_api = "responses" именно из-за этого ограничения.
Шаг 1: Получите API-ключ
Войдите к провайдеру, создайте ключ и экспортируйте его.
export OPENAI_API_KEY="ofx_live_..."
Шаг 2: Отредактируйте ~/.codex/config.toml
Добавьте блок [model_providers.<id>]. Идентификатор провайдера openai зарезервирован — используйте любую другую метку.
model = "openai/gpt-5.4-mini"
model_provider = "ofox"
[model_providers.ofox]
name = "ofox.ai Responses API"
base_url = "https://api.ofox.ai/v1"
wire_api = "responses"
env_key = "OPENAI_API_KEY"
Шаг 3: Проверьте /status и одиночным вызовом
Запустите REPL, проверьте активную модель и счётчики, затем отправьте one-shot в неинтерактивном режиме exec:
codex # открывает REPL, затем введите /status в приглашении
codex exec "print hello in python"
Успешный one-shot означает, что протокол совпал. Если видите Unsupported wire_api, выбранная модель не поддерживает Responses — выберите вариант с тюнингом под Codex в маркетплейсе моделей ofox, где показан тег Responses, или прочитайте более глубокий разбор в Как использовать любую модель с Codex CLI.
Шаг 4: Установите переопределение модели на сессию (опционально)
Для одноразовых сложных рефакторингов меняйте модели без правки конфига (Codex CLI принимает -m / --model; сочетайте с exec для одиночного неинтерактивного запуска):
codex exec -m openai/gpt-5.5 "refactor the auth middleware"
Если нужны пояснения по каждому полю конфигурации, канонический справочник — Codex CLI config.toml: глубокий разбор, а руководство по настройке Codex CLI API описывает путь только через переменные окружения, если вы хотите обойти TOML.
Частые ошибки во время настройки
| Ошибка | Причина | Решение |
|---|---|---|
Unsupported wire_api | Модель не реализует /v1/responses | Выберите вариант с тюнингом под Codex; маркетплейс помечает поддерживаемые модели |
Authentication failed | Завершающий слеш в base_url или не та переменная окружения | Используйте ровно https://api.ofox.ai/v1; убедитесь, что env_key совпадает с экспортированной переменной |
Provider id reserved | Использован openai, ollama или lmstudio как метка блока | Переименуйте блок, например [model_providers.ofox] |
Model not found | Неверный префикс провайдера | Всегда включайте префикс провайдера в id модели, например openai/gpt-5.4-mini, а не gpt-5.4-mini |
Connection reset | Сеть/прокси между CLI и эндпоинтом | На время теста отключите корпоративные CA-прокси; повторите без VPN |
Подводные камни при переключении между подпиской и drop-in
Несколько тонких поведений проявляются только при первом перепрыгивании между режимами:
/statusвсё ещё отчитывается по счётчикам подписки, даже еслиmodel_providerуказывает на drop-in. CLI не показывает баланс drop-in-аккаунта в/status— смотрите панель провайдера. Если на панели нормальный баланс, а/statusпоказывает 0% за неделю — вы читаете счётчик подписки, а не drop-in.- Токены аутентификации делят одну переменную окружения. Если оставите ключ OpenAI в
OPENAI_API_KEYи потом переключите на drop-in-ключ под той же переменной, каждый следующий вызов CLI пойдёт в drop-in, пока вы не переключите обратно. Без предупреждения. Если переключаетесь ежедневно, заведите разные алиасы (use-plus,use-ofox). - Конфиг на уровне проекта побеждает глобальный.
./codex.tomlв корне проекта переопределяет~/.codex/config.toml. Закоммитьте командный drop-in-конфиг на уровне проекта, чтобы инженеры случайно не маршрутизировали через личный Plus при отладке общего кода. - Смена модели в середине сессии не обновляет инструменты. Если ввести
/modelв середине сессии и выбрать другой вариант (например,openai/gpt-5.5) из попапа, новая модель подхватит контекст, но кэшированные описания инструментов не пересоберутся. После смены флагмана перезапустите сессию, если видите регрессии в использовании инструментов.
Потолок расходов на drop-in API: 3 паттерна
Маршрут с поминутной оплатой бьёт подписку только если вы реально удерживаете счёт в границах. Три паттерна, упорядоченных по силе принуждения.
Паттерн 1 — Предоплаченный кошелёк (самая жёсткая остановка)
Пополните счёт фиксированной суммой (скажем, $20). Когда кошелёк дойдёт до нуля, API откажется обслуживать вызовы. Это единственный способ, переживающий ошибки оператора, потому что остановка обеспечивается выше по потоку, а не в локальном конфиге.
Проверяйте остаток перед каждым пополнением по панели провайдера, а не локальным скриптом — числа панели авторитетны, и вы избежите расхождения между локальным кэшем и состоянием аккаунта.
Паттерн 2 — Понижение тарифа на задачу
Используйте самую дешёвую жизнеспособную модель на задачу. Флаг модели Codex CLI задаётся на вызов, поэтому скрипт-обёртка, выбирающий уровень по намерению команды, держит стоимость за вызов честной.
codex_tiered() {
case "$1" in
refactor|migrate) codex exec -m openai/gpt-5.5 "${@:2}" ;;
*) codex exec -m openai/gpt-5.4-mini "${@:2}" ;;
esac
}
Понижение незаметно для кодовой базы — оно живёт исключительно в shell.
Паттерн 3 — Cron с дневным бюджетом
Удерживайте дневные расходы локальным аккумулятором. Аккумулятор сбрасывается в полночь через cron, а обёртка прерывает вызов по достижении дневного потолка.
# ~/.codex/budget.sh
TODAY=$(date +%F)
SPENT_FILE=~/.codex/spent.$TODAY
DAY_CAP_USD="${DAY_CAP_USD:-3.00}"
spent=$(cat "$SPENT_FILE" 2>/dev/null || echo 0)
awk -v s="$spent" -v c="$DAY_CAP_USD" 'BEGIN{exit !(s<c)}' || {
echo "Codex daily cap $DAY_CAP_USD reached. Wait or raise DAY_CAP_USD." >&2
exit 1
}
codex "$@"
Математика честна только если вы реально логируете стоимость каждого вызова обратно в $SPENT_FILE — повесьте post-call хук, который это делает.
| Паттерн | Где принуждается остановка | Риск перерасхода | Кому подходит |
|---|---|---|---|
| Предоплаченный кошелёк | На стороне аккаунта | Нет (жёсткий стоп) | Соло-разработчик, фиксированный месячный бюджет |
| Понижение тарифа | Флаг модели на вызов | Средний (нет совокупного потолка) | Смешанные нагрузки |
| Cron дневного бюджета | Локальная shell-обёртка | Высокий (только локальный, обходится) | Командные shared shells с отчётностью |
Как выбрать из трёх
Если берёте только одно — берите предоплату. Это единственный механизм, переживающий плохие дни: открытые Slack-вкладки, забытый терминал, разогнавшийся цикл в пятницу перед отпуском. Потолок кошелька — не дисциплина будущего вас, а внешнее принуждение, которое будущий вы не сможет перебить под стрессом.
Наслаивайте остальные сверху:
- Предоплаченный кошелёк один закрывает сценарий «я забыл про счётчик».
- Предоплата + понижение тарифа закрывают сценарий «этой задаче не нужен был флагман» и растягивают кошелёк в 3–5 раз на практике.
- Все три вместе дают мягкий дневной потолок, который ловит сюрпризы в тот же день, и всё ещё доверяет кошельку как жёсткому страховщику. Это рекомендуемый стек для любой команды, где Codex критичен для миссии.
Отдельно про понижение тарифа: не гонитесь за самой дешёвой моделью на задачи рефакторинга. Разрыв в стоимости между самым маленьким вариантом Codex и флагманом часто меньше, чем стоимость одной волны отладки из-за деградировавшего ответа. Используйте флагман для рефакторинга и миграций; малый вариант — для генерации шаблонов, форматирования и однострочных правок, где разрыв редко проявляется.
Конфигурация для команды/нескольких разработчиков
Описанные выше паттерны масштабируются на команды переносом потолка на аккаунт провайдера, а не на shell каждого инженера. Три привычки, стоящие закрепления:
- Один общий аккаунт ofox на команду, отдельные API-ключи на инженера — позволяет отзывать отдельных людей без ротации всех, и потолок кошелька применяется ко всему пулу.
- Запиньте командный
config.tomlв dotfiles — закоммитьте санированную версию в командный репозиторийdotfiles, чтобы Codex CLI каждого инженера приземлялся на одних значениях провайдер/wire/модель; только API-ключ остаётся персональным в~/.config/credentials(не в репозитории). - Недельная сводка расходов — выгрузка использования провайдера может питать Slack-дайджест каждый понедельник, чтобы всплески всплывали за дни, а не в конце месяца. Подключите один раз — и больше не будете отлаживать фантомный счёт на $400.
Если в общем пуле Codex 5+ инженеров, Как настроить Codex CLI с пользовательским API-эндпоинтом описывает путь только через переменные окружения, который проще развернуть через Ansible, чем TOML.
Миграция кодовой базы в середине проекта без простоя
Реалистичная командная ситуация такова: половина инженеров в середине спринта настроена на личных подписках Plus; командный аккаунт Pro только что упёрся в недельный. Просить всех остановиться и переконфигурироваться нельзя. Три хода сохраняют спринт живым:
- Поднимите командный API-ключ через переменные окружения — инженеры добавляют
export OPENAI_API_KEY=$TEAM_OFOX_KEYиexport OPENAI_BASE_URL=https://api.ofox.ai/v1в shell rc, без изменений в config.toml. Путь через переменные в Codex CLI на время сессии перебивает личные подписки. - Резервируйте флагман инженеру с самым длинным рефакторингом — остальные используют меньший вариант Codex. Самая дешёвая поза восстановления на день спринта.
- Утром аудитируйте, какие сессии реально нуждаются в перерасходе — если недельный обвал командного был разовым (автономный прогон одного инженера), откатите переменные и оставайтесь на подписке. Если это паттерн, закоммитьте командный
config.tomlв dotfiles на ближайшем стендапе и прекратите прыжки.
Ошибка большинства команд — относиться к drop-in API как к панической мере и откатывать его, как только недельный сбрасывается. Правильная рамка обратная: подписка — дефолт для предсказуемой соло-работы; тарифицируемый API — дефолт для устойчивой командной. Недельный обвал — всего лишь сигнал, что вы выбрали не тот дефолт.
Когда drop-in API лежит: рабочие альтернативы
| Альтернатива | Протокол | Готовность Codex CLI | Когда выбрать |
|---|---|---|---|
| ofox.ai | Responses + Chat Completions | Да, маркетплейс помечает модели с поддержкой Responses | Смешанные кодовые нагрузки, оплата по токенам с прозрачной ценой на модель (документация интеграции Codex) |
| OpenRouter | Responses через роутер | Да | Хотите один счёт по многим провайдерам и принимаете наценку роутера |
| Прямой OpenAI API | Нативный Responses | Да | Хотите ровно тех же моделей, что в ChatGPT, и согласны на полную розничную цену |
| Self-hosted (LiteLLM gateway) | Перевод Chat→Responses | Через транслятор | Уже держите шлюз и хотите маршрутизировать с любых Chat-only бэкендов |
| Дождаться естественного сброса | n/a | n/a | Работа умещается в следующее недельное окно с запасом накопленного сброса |
Глубокое погружение в маршрутизацию между провайдерами и failover — в Настройка Codex CLI с пользовательским API-эндпоинтом и Как использовать любую модель с Codex CLI.
Как мониторить статус Codex и получать алерты
Три слоя по нарастанию точности.
- Официальная страница статуса: добавьте в закладки status.openai.com — инциденты рассинхрона обычно появляются там в часы после сообщений сообщества.
- Внутрисессионный
/status: введите его в приглашении Codex REPL (после запускаcodex), чтобы вывести активную модель,5hи недельный остаток. Дешёвый вызов; запускайте перед каждой длинной задачей. - Опрос дашборда аккаунта: cron каждые 5 минут на эндпоинт использования ловит дрейф между
/statusи серверным счётчиком (паттерн рассинхрона мая 2026). Лейте в Slack приweekly < 10%.
Для более глубокого опроса эндпоинт использования OpenAI отдаёт совокупное потребление по аккаунту, которое можно скрести по cron — обзор панели на platform.openai.com/usage, а что значит каждый счётчик — в заметке Help Center OpenAI о лимитах Codex. Кросс-проверка дашборда против внутрисессионного /status — единственный самый полезный сигнал для раннего обнаружения паттерна рассинхрона мая 2026.
Что эта статья не покрывает
Несколько границ области, чтобы вы перешли к правильному источнику:
- Проблемы установки Codex CLI: сначала Codex command not found: фикс через npm install.
AGENTS.mdне загружается в symlink-ed рабочих пространствах: подходит гайд по фиксу.- Сравнение инструментов (Codex vs Claude Code vs Cursor): этот бенчмарк покрывает компромиссы.
Если ваш недельный потолок Codex умирает дважды в месяц, переход на тарифицируемый API с потолком предоплаченного кошелька — не понижение, а смена шведского стола на меню навынос: вы платите только за блюда, которые реально заказали, и счётчик тикает только на работе, которая доходит до релиза.
Источники, проверенные для этого обновления
- OpenAI Developers — Codex Configuration Reference (проверено 2026-06-15)
- OpenAI Help Center — Using Codex with your ChatGPT plan (проверено 2026-06-15)
- Тред сообщества OpenAI — недельный лимит Codex упал с 96% до 0% за день (17–20 мая 2026)
- Тред сообщества OpenAI — single prompt eats 7% of weekly limits (Plus)
- Тред сообщества OpenAI — Weekly limit ran out even though I never hit the 5-hour limit
- Объявление сообщества OpenAI — сброс лимитов для всех платных планов 28 апреля 2026
- Pasquale Pillitteri — Codex теперь позволяет сохранять сбросы лимитов (12 июня 2026)
- Документация интеграции ofox.ai Codex CLI (проверено 2026-06-15)
- Снимок маркетплейса моделей ofox.ai, 2026-06-15


