Codex недельный лимит: 5 способов и API drop-in с потолком (2026)
(updated )

Codex недельный лимит: 5 способов и API drop-in с потолком (2026)

17 мая 2026 пользователь Plus смотрел, как недельный счётчик Codex падает с 96% до 0% за один день — а представитель OpenAI, признавший инцидент, всё равно не мог обещать сброс счётчика до естественного недельного окна. Если ваш недельный потолок умирает дважды в месяц, правильный шаг в 2026 — не обновлять /status, а направить Codex CLI на эндпоинт с поминутной оплатой и зафиксировать потолок расходов на кошельке, а не в календаре.

Эта статья проходит конкретный путь починки исчерпанного недельного потолка: drop-in API, совместимый с OpenAI Responses, настраиваемый одним блоком в ~/.codex/config.toml, плюс три паттерна удержания месячного счёта в границах. Полный справочник конфигурации (пользовательские провайдеры, заголовки, идентификаторы моделей) — в статье Настройка Codex CLI с пользовательским API-эндпоинтом.

Квота Codex действительно исчерпана? Диагностика за 30 секунд

Прежде чем что-либо менять, убедитесь, что проблема именно в счётчике, а не в ошибке соединения или модели, замаскированной под лимит.

СимптомЧто показывает /statusЧто это значитПервый шаг
Баннер: «You’ve hit your weekly limit»weekly: 0% remainingНедельный потолок исчерпан, в 5-часовом ещё может быть запасМаршрут без недельного счётчика (drop-in API) или потратьте накопленный сброс
Баннер: «5-hour limit reached»5h: 0% remaining / weekly > 0%Только короткая пробуксовкаПодождать, переключиться на не-CLI задачи, или прогнать тот же промпт через drop-in API
Ошибка: usage_limit_reachedweekly и 5h оба > 0%Баг рассинхронизации счётчиков (известная проблема мая 2026)Перезапустите CLI; если повторяется — на статус OpenAI и в drop-in fallback
Ошибка: Unsupported wire_apiнесовпадение провайдераПользовательский провайдер не говорит по Responses APIСменить модель или добавить транслятор Responses

Запустите Codex REPL командой codex и сначала введите /status. Если он говорит, что недельный счётчик ненулевой, но сессия не стартует — вы видите паттерн рассинхрона счётчиков, который Tibo из OpenAI публично признал в X в мае 2026, и переход на drop-in API быстрее, чем ожидание согласования счётчиков.

Когда применять эти решения (а когда просто подождать)

Не каждое падение оправдывает изменение конфигурации. Прогоните этот фильтр, прежде чем трогать config.toml.

Чинить сейчас (настраивать drop-in API):

  • Недельный счётчик умирает чаще одного раза в календарный месяц, и вы в середине релиза.
  • Упёрлись в потолок в пятницу днём, а естественный сброс наступит после конца спринта.
  • Вы пользователь Plus и видите 5h: 0% remaining сразу после свежего сброса — паттерн рассинхрона мая 2026.

Подождать:

  • До естественного недельного сброса меньше 24 часов, и работа не срочная.
  • У вас есть накопленный сброс (по отчётам третьих сторон — у подходящих аккаунтов примерно с 12 июня 2026), и оставшаяся работа умещается в одно окно.
  • Вы на Pro, и просадка потолка меньше 25% — запас по пропускной способности Pro обычно поглощает всплески одного спринта.

Правило остановки: если ваш месячный эквивалент платы за Codex (подписка + перерасход) превышает два места Pro — вам нужно постоянно сидеть на тарифицируемом API, а не прыгать между уровнями подписки. Сначала прочитайте секцию про математику цен — если арифметика решающая, остальное можно пропустить.

Понимание лимитов Codex: 5-часовой, недельный и кредиты

Codex наслаивает четыре счётчика, и сценарий поломки зависит от того, какой сработал.

СчётчикОбластьПериод сбросаЧто его расходует
5-часовое окносообщения CLI + облачных задачскользящие 5 часоввсплески активных сессий, многошаговые рефакторинги
Недельный потолоктот же пул, шире окноскользящие 7 днейустойчивая ежедневная работа, длинные автономные прогоны
Кредитызависит от плана, на стороне аккаунтапополняется по условиям планарасширяет недельный, когда план это поддерживает
Накопленный сбростокен на стороне аккаунтаразово; пополняется через рефералов или планодноразовая очистка счётчика

Несколько деталей, на которые официальная документация лишь намекает:

  • Урон от одного промпта: в ноябрьском треде сообщества 2025 года «single prompt eats 7% of weekly limits» пользователи Plus замеряли, что одиночные вызовы Codex CLI на отдельных вариантах модели съедают около 7% недельного потолка. Форма сохранилась и в майских инцидентах 2026 — четырнадцать таких промптов за неделю, и вы сухи.
  • Только локальная работа вас не спасёт: тред «Weekly limit ran out even though I never hit the 5-hour limit» документирует расход недельного без 5-часовой активности — счётчики независимы, и недельный срабатывает по совокупному объёму.
  • Кредиты — это не «кнопка пополнения»: OpenAI явно не позиционирует кредиты как универсальное пополнение потолка. Они расширяют поддерживаемые сценарии, а не каждую границу безопасности.

Полный разбор счётчиков — в How Codex Usage Limits Work.

Почему недельный потолок выгорает быстрее 5-часового

Самая контринтуитивная особенность счётчиков Codex в 2026 — удивляет вас именно недельный, а не 5-часовой. Три структурные причины:

Облачные задачи считаются иначе. Сессия Codex CLI с быстрой правкой локального файла потребляет небольшой ломтик. Тот же промпт, отправленный как облачная задача с многошаговым планированием и инструментами, может умножить недельный эквивалент без касания 5-часового потолка — потому что работа облачной задачи происходит вне скользящего локального окна, но всё равно ложится в недельный аккумулятор.

Тяжёлые по рассуждениям варианты складываются. Варианты с тюнингом под Codex, лучшие на бенчмарках рефакторинга — те, к которым тянешься в пятницу днём, когда работа критична — одновременно самые прожорливые на вызов. Один автономный прогон 30+ минут на флагмане может равняться десяткам обычных сообщений Plus в недельных бюджетах.

Счётчики согласуются асинхронно. 5-часовой отражает локальное намерение. Недельный — серверное согласование после кредитов, облачных задач и любых корректировок на стороне плана. Майский инцидент рассинхрона 2026, публично признанный OpenAI, — это видимый отказ согласования; но обычное ежедневное использование тоже показывает мелкие зазоры синхронизации, иногда складывающиеся в момент «куда делось 30% моей недели?».

Практический вывод: не бюджетируйте по 5-часовому наблюдению. Читайте недельный счётчик как реальный потолок, а 5-часовой — как ограничитель скорости на каждый всплеск. Если относиться к недельному как к плановой единице с первого дня, к среде вас уже не застанут врасплох.

Как восстановиться при исчерпании недельного лимита (по тарифам)

Free / Go

flowchart LR
    A[Недельный лимит исчерпан] --> B{Есть накопленный сброс?}
    B -->|Да| C[Потратить сейчас]
    B -->|Нет| D{В окне рефералов<br/>11–24 июня 2026?}
    D -->|Да| E[Пригласить до 3 друзей]
    D -->|Нет| F[Переключить CLI на drop-in API]
    C --> G[Продолжить работу]
    E --> G
    F --> G

У Go самый маленький недельный потолок. Бесплатный накопленный сброс, идущий с подходящими аккаунтами, — ваш ход с наибольшим рычагом; потратьте его на сессию, которую нельзя отложить.

Plus

ХодКогда выбиратьУсилие
Потратить накопленный сбросУ вас один есть, и оставшаяся работа умещается в одно недельное окно5 секунд
Активировать подходящие кредитыНа дашборде аккаунта показаны кредиты30 секунд
Переключиться на drop-in APIПадения дважды в месяц или чащеРазовая настройка 3 минуты
Апгрейд до ProСтабильно выжигаете недельный за 3 дня после сбросаПо странице планов OpenAI

Plus — счётчик, наиболее уязвимый к майскому инциденту 2026: тред про падение с 96% до 0% за день состоит преимущественно из сообщений Plus. Если паттерн повторяется, drop-in API — не запасной, а основной маршрут.

Pro

У Pro самый большой недельный запас, но и он не иммунен. В том же майском инциденте 2026 пользователь Pro сообщил о падении лимита со 100% до 60% за час без тяжёлой работы. Путь восстановления идентичен Plus, только Pro 20x дольше держится против урона от одного промпта.

Для проверки состояния со стороны аккаунта запустите codex и введите /status, чтобы увидеть внутрисессионные 5h / weekly, и сравните с панелью использования OpenAI на platform.openai.com/usage. Внутрисессионный счётчик — клиентский взгляд; дашборд — серверное согласование. Когда они расходятся больше чем на 10 пунктов, перед вами паттерн рассинхрона, признанный Tibo из OpenAI в мае 2026: перезапустите CLI, и если разрыв сохраняется, переключайтесь на путь drop-in API ниже, не дожидаясь сведения счётчиков.

Инциденты с недельным лимитом Codex в 2026: что именно сгорело быстрее

ДатаПланЧто произошлоИсточник
28 апреля 2026Все платныеПлановый общий сброс лимитовОбъявление сообщества OpenAI
17 мая 2026PlusПользователь afaqak: недельный с 96% до 0% за день при минимальной нагрузкеТред сообщества #1381172
18 мая 2026ProПользователь 3rtech: недельный со 100% до 60% за час без тяжёлой работыТот же тред
18 мая 2026PlusПользователь Brian_Henderson: 0% остатка в 5-часовом окне после рестартаТот же тред
20 мая 2026PlusПользователь minifi: падение изолировано на одном варианте модели CodexТот же тред
~12 июня 2026 (по сторонним отчётам)Go / Plus / Pro / BusinessФункция накопленных сбросов начинает разворачиваться — каждый аккаунт, по сообщениям, получает 1 бесплатный сброс; официальной страницы анонса не найденоСводка Pasquale Pillitteri

Паттерн: счётчики согласуются на сервере, а рассинхрон — самый частый отказ, с которым вы столкнётесь. Drop-in API убирает этот отказ целиком, потому что счётчик живёт на вашем кошельке.

Починка через drop-in API: настроить Codex CLI в 5 строк

Изменение протокола проводной коммуникации в феврале 2026 здесь принципиально. Codex CLI отказался от поддержки Chat Completions и теперь говорит только по OpenAI Responses API. Любой провайдер, на который вы его направите, должен открывать /v1/responses. Документированная интеграция ofox.ai для Codex задаёт wire_api = "responses" именно из-за этого ограничения.

Шаг 1: Получите API-ключ

Войдите к провайдеру, создайте ключ и экспортируйте его.

export OPENAI_API_KEY="ofx_live_..."

Шаг 2: Отредактируйте ~/.codex/config.toml

Добавьте блок [model_providers.<id>]. Идентификатор провайдера openai зарезервирован — используйте любую другую метку.

model = "openai/gpt-5.4-mini"
model_provider = "ofox"

[model_providers.ofox]
name = "ofox.ai Responses API"
base_url = "https://api.ofox.ai/v1"
wire_api = "responses"
env_key = "OPENAI_API_KEY"

Шаг 3: Проверьте /status и одиночным вызовом

Запустите REPL, проверьте активную модель и счётчики, затем отправьте one-shot в неинтерактивном режиме exec:

codex            # открывает REPL, затем введите /status в приглашении
codex exec "print hello in python"

Успешный one-shot означает, что протокол совпал. Если видите Unsupported wire_api, выбранная модель не поддерживает Responses — выберите вариант с тюнингом под Codex в маркетплейсе моделей ofox, где показан тег Responses, или прочитайте более глубокий разбор в Как использовать любую модель с Codex CLI.

Шаг 4: Установите переопределение модели на сессию (опционально)

Для одноразовых сложных рефакторингов меняйте модели без правки конфига (Codex CLI принимает -m / --model; сочетайте с exec для одиночного неинтерактивного запуска):

codex exec -m openai/gpt-5.5 "refactor the auth middleware"

Если нужны пояснения по каждому полю конфигурации, канонический справочник — Codex CLI config.toml: глубокий разбор, а руководство по настройке Codex CLI API описывает путь только через переменные окружения, если вы хотите обойти TOML.

Частые ошибки во время настройки

ОшибкаПричинаРешение
Unsupported wire_apiМодель не реализует /v1/responsesВыберите вариант с тюнингом под Codex; маркетплейс помечает поддерживаемые модели
Authentication failedЗавершающий слеш в base_url или не та переменная окруженияИспользуйте ровно https://api.ofox.ai/v1; убедитесь, что env_key совпадает с экспортированной переменной
Provider id reservedИспользован openai, ollama или lmstudio как метка блокаПереименуйте блок, например [model_providers.ofox]
Model not foundНеверный префикс провайдераВсегда включайте префикс провайдера в id модели, например openai/gpt-5.4-mini, а не gpt-5.4-mini
Connection resetСеть/прокси между CLI и эндпоинтомНа время теста отключите корпоративные CA-прокси; повторите без VPN

Подводные камни при переключении между подпиской и drop-in

Несколько тонких поведений проявляются только при первом перепрыгивании между режимами:

  • /status всё ещё отчитывается по счётчикам подписки, даже если model_provider указывает на drop-in. CLI не показывает баланс drop-in-аккаунта в /status — смотрите панель провайдера. Если на панели нормальный баланс, а /status показывает 0% за неделю — вы читаете счётчик подписки, а не drop-in.
  • Токены аутентификации делят одну переменную окружения. Если оставите ключ OpenAI в OPENAI_API_KEY и потом переключите на drop-in-ключ под той же переменной, каждый следующий вызов CLI пойдёт в drop-in, пока вы не переключите обратно. Без предупреждения. Если переключаетесь ежедневно, заведите разные алиасы (use-plus, use-ofox).
  • Конфиг на уровне проекта побеждает глобальный. ./codex.toml в корне проекта переопределяет ~/.codex/config.toml. Закоммитьте командный drop-in-конфиг на уровне проекта, чтобы инженеры случайно не маршрутизировали через личный Plus при отладке общего кода.
  • Смена модели в середине сессии не обновляет инструменты. Если ввести /model в середине сессии и выбрать другой вариант (например, openai/gpt-5.5) из попапа, новая модель подхватит контекст, но кэшированные описания инструментов не пересоберутся. После смены флагмана перезапустите сессию, если видите регрессии в использовании инструментов.

Потолок расходов на drop-in API: 3 паттерна

Маршрут с поминутной оплатой бьёт подписку только если вы реально удерживаете счёт в границах. Три паттерна, упорядоченных по силе принуждения.

Паттерн 1 — Предоплаченный кошелёк (самая жёсткая остановка)

Пополните счёт фиксированной суммой (скажем, $20). Когда кошелёк дойдёт до нуля, API откажется обслуживать вызовы. Это единственный способ, переживающий ошибки оператора, потому что остановка обеспечивается выше по потоку, а не в локальном конфиге.

Проверяйте остаток перед каждым пополнением по панели провайдера, а не локальным скриптом — числа панели авторитетны, и вы избежите расхождения между локальным кэшем и состоянием аккаунта.

Паттерн 2 — Понижение тарифа на задачу

Используйте самую дешёвую жизнеспособную модель на задачу. Флаг модели Codex CLI задаётся на вызов, поэтому скрипт-обёртка, выбирающий уровень по намерению команды, держит стоимость за вызов честной.

codex_tiered() {
  case "$1" in
    refactor|migrate) codex exec -m openai/gpt-5.5 "${@:2}" ;;
    *) codex exec -m openai/gpt-5.4-mini "${@:2}" ;;
  esac
}

Понижение незаметно для кодовой базы — оно живёт исключительно в shell.

Паттерн 3 — Cron с дневным бюджетом

Удерживайте дневные расходы локальным аккумулятором. Аккумулятор сбрасывается в полночь через cron, а обёртка прерывает вызов по достижении дневного потолка.

# ~/.codex/budget.sh
TODAY=$(date +%F)
SPENT_FILE=~/.codex/spent.$TODAY
DAY_CAP_USD="${DAY_CAP_USD:-3.00}"
spent=$(cat "$SPENT_FILE" 2>/dev/null || echo 0)
awk -v s="$spent" -v c="$DAY_CAP_USD" 'BEGIN{exit !(s<c)}' || {
  echo "Codex daily cap $DAY_CAP_USD reached. Wait or raise DAY_CAP_USD." >&2
  exit 1
}
codex "$@"

Математика честна только если вы реально логируете стоимость каждого вызова обратно в $SPENT_FILE — повесьте post-call хук, который это делает.

ПаттернГде принуждается остановкаРиск перерасходаКому подходит
Предоплаченный кошелёкНа стороне аккаунтаНет (жёсткий стоп)Соло-разработчик, фиксированный месячный бюджет
Понижение тарифаФлаг модели на вызовСредний (нет совокупного потолка)Смешанные нагрузки
Cron дневного бюджетаЛокальная shell-обёрткаВысокий (только локальный, обходится)Командные shared shells с отчётностью

Как выбрать из трёх

Если берёте только одно — берите предоплату. Это единственный механизм, переживающий плохие дни: открытые Slack-вкладки, забытый терминал, разогнавшийся цикл в пятницу перед отпуском. Потолок кошелька — не дисциплина будущего вас, а внешнее принуждение, которое будущий вы не сможет перебить под стрессом.

Наслаивайте остальные сверху:

  • Предоплаченный кошелёк один закрывает сценарий «я забыл про счётчик».
  • Предоплата + понижение тарифа закрывают сценарий «этой задаче не нужен был флагман» и растягивают кошелёк в 3–5 раз на практике.
  • Все три вместе дают мягкий дневной потолок, который ловит сюрпризы в тот же день, и всё ещё доверяет кошельку как жёсткому страховщику. Это рекомендуемый стек для любой команды, где Codex критичен для миссии.

Отдельно про понижение тарифа: не гонитесь за самой дешёвой моделью на задачи рефакторинга. Разрыв в стоимости между самым маленьким вариантом Codex и флагманом часто меньше, чем стоимость одной волны отладки из-за деградировавшего ответа. Используйте флагман для рефакторинга и миграций; малый вариант — для генерации шаблонов, форматирования и однострочных правок, где разрыв редко проявляется.

Конфигурация для команды/нескольких разработчиков

Описанные выше паттерны масштабируются на команды переносом потолка на аккаунт провайдера, а не на shell каждого инженера. Три привычки, стоящие закрепления:

  1. Один общий аккаунт ofox на команду, отдельные API-ключи на инженера — позволяет отзывать отдельных людей без ротации всех, и потолок кошелька применяется ко всему пулу.
  2. Запиньте командный config.toml в dotfiles — закоммитьте санированную версию в командный репозиторий dotfiles, чтобы Codex CLI каждого инженера приземлялся на одних значениях провайдер/wire/модель; только API-ключ остаётся персональным в ~/.config/credentials (не в репозитории).
  3. Недельная сводка расходов — выгрузка использования провайдера может питать Slack-дайджест каждый понедельник, чтобы всплески всплывали за дни, а не в конце месяца. Подключите один раз — и больше не будете отлаживать фантомный счёт на $400.

Если в общем пуле Codex 5+ инженеров, Как настроить Codex CLI с пользовательским API-эндпоинтом описывает путь только через переменные окружения, который проще развернуть через Ansible, чем TOML.

Миграция кодовой базы в середине проекта без простоя

Реалистичная командная ситуация такова: половина инженеров в середине спринта настроена на личных подписках Plus; командный аккаунт Pro только что упёрся в недельный. Просить всех остановиться и переконфигурироваться нельзя. Три хода сохраняют спринт живым:

  1. Поднимите командный API-ключ через переменные окружения — инженеры добавляют export OPENAI_API_KEY=$TEAM_OFOX_KEY и export OPENAI_BASE_URL=https://api.ofox.ai/v1 в shell rc, без изменений в config.toml. Путь через переменные в Codex CLI на время сессии перебивает личные подписки.
  2. Резервируйте флагман инженеру с самым длинным рефакторингом — остальные используют меньший вариант Codex. Самая дешёвая поза восстановления на день спринта.
  3. Утром аудитируйте, какие сессии реально нуждаются в перерасходе — если недельный обвал командного был разовым (автономный прогон одного инженера), откатите переменные и оставайтесь на подписке. Если это паттерн, закоммитьте командный config.toml в dotfiles на ближайшем стендапе и прекратите прыжки.

Ошибка большинства команд — относиться к drop-in API как к панической мере и откатывать его, как только недельный сбрасывается. Правильная рамка обратная: подписка — дефолт для предсказуемой соло-работы; тарифицируемый API — дефолт для устойчивой командной. Недельный обвал — всего лишь сигнал, что вы выбрали не тот дефолт.

Когда drop-in API лежит: рабочие альтернативы

АльтернативаПротоколГотовность Codex CLIКогда выбрать
ofox.aiResponses + Chat CompletionsДа, маркетплейс помечает модели с поддержкой ResponsesСмешанные кодовые нагрузки, оплата по токенам с прозрачной ценой на модель (документация интеграции Codex)
OpenRouterResponses через роутерДаХотите один счёт по многим провайдерам и принимаете наценку роутера
Прямой OpenAI APIНативный ResponsesДаХотите ровно тех же моделей, что в ChatGPT, и согласны на полную розничную цену
Self-hosted (LiteLLM gateway)Перевод Chat→ResponsesЧерез трансляторУже держите шлюз и хотите маршрутизировать с любых Chat-only бэкендов
Дождаться естественного сбросаn/an/aРабота умещается в следующее недельное окно с запасом накопленного сброса

Глубокое погружение в маршрутизацию между провайдерами и failover — в Настройка Codex CLI с пользовательским API-эндпоинтом и Как использовать любую модель с Codex CLI.

Как мониторить статус Codex и получать алерты

Три слоя по нарастанию точности.

  1. Официальная страница статуса: добавьте в закладки status.openai.com — инциденты рассинхрона обычно появляются там в часы после сообщений сообщества.
  2. Внутрисессионный /status: введите его в приглашении Codex REPL (после запуска codex), чтобы вывести активную модель, 5h и недельный остаток. Дешёвый вызов; запускайте перед каждой длинной задачей.
  3. Опрос дашборда аккаунта: cron каждые 5 минут на эндпоинт использования ловит дрейф между /status и серверным счётчиком (паттерн рассинхрона мая 2026). Лейте в Slack при weekly < 10%.

Для более глубокого опроса эндпоинт использования OpenAI отдаёт совокупное потребление по аккаунту, которое можно скрести по cron — обзор панели на platform.openai.com/usage, а что значит каждый счётчик — в заметке Help Center OpenAI о лимитах Codex. Кросс-проверка дашборда против внутрисессионного /status — единственный самый полезный сигнал для раннего обнаружения паттерна рассинхрона мая 2026.

Что эта статья не покрывает

Несколько границ области, чтобы вы перешли к правильному источнику:

Если ваш недельный потолок Codex умирает дважды в месяц, переход на тарифицируемый API с потолком предоплаченного кошелька — не понижение, а смена шведского стола на меню навынос: вы платите только за блюда, которые реально заказали, и счётчик тикает только на работе, которая доходит до релиза.

Источники, проверенные для этого обновления