Могут ли sub-agents в Claude Code запускать других sub-agents?

Да, с версии v2.1.172 (10 июня 2026). Sub-agents теперь могут запускать собственных sub-agents — до 5 уровней вглубь. До этой версии инструмент Agent был отключён внутри sub-agent контекстов, чтобы избежать бесконечной рекурсии. Именно поэтому старые доки и туториалы до сих пор пишут, что вложенность невозможна.

Сколько sub-agents Claude Code может запустить одновременно?

Жёсткого лимита параллелизма нет, но каждая параллельная ветка несёт собственное окно контекста и тратит токены независимо. Официальные доки приводят правило: workflow с активным использованием sub-agents потребляет примерно в 7 раз больше токенов, чем однопоточная сессия. Стоит запустить 3-4 параллельные ветки — счёт за токены ударит раньше, чем заметна задержка.

Какую модель ставить на вложенные sub-agents?

Листья по умолчанию — Haiku через `model: haiku` в frontmatter sub-agent. Sonnet оставьте для веток, где нужна модификация кода, Opus — только корневому reasoner. Чем дальше от корня, тем дешевле модель — это обратное тому, как команды обычно настраивают.

Как предотвратить бесконтрольный вложенный sub-agent в Claude Code?

Три ограждения: ставьте `maxTurns` в каждом sub-agent (типичное значение 8-15), сужайте `tools` до минимума, и используйте `Agent(specific-name)` allowlist в `tools` родителя — он сможет запускать только перечисленных детей. Параметр `permissions.deny` глобально блокирует конкретные типы sub-agents.

Делят ли вложенные sub-agents контекст с родителем?

Нет. Каждый sub-agent работает в собственном окне контекста с собственным system prompt и получает от родителя только описание задачи. Назад родителю возвращается summary. Эта изоляция — задумка, но она же причина того, что вложенность умножает расход токенов, а не делит.

Может ли вложенный sub-agent использовать MCP-серверы, которых нет у родителя?

Да. Поле `mcpServers` в frontmatter sub-agent описывает inline-определения серверов, которые подключаются только во время работы этого sub-agent. Удобно, когда Playwright или Postgres нужен только листу — без раздувания списка инструментов главной сессии.

Чем вложенные sub-agents отличаются от agent teams в Claude Code?

Sub-agents (вложенные или нет) работают внутри одной Claude Code сессии, делят её верхнеуровневый user prompt и возвращают результат родителю. Agent teams — это отдельные сессии, которые общаются между собой и живут дольше одного разговора. Вложенные sub-agents подходят для divide-and-conquer внутри одной задачи; agent teams — для длительного взаимодействия через множество задач.

Работает ли ofox.ai со sub-agents Claude Code?

Да. Sub-agents наследуют `ANTHROPIC_BASE_URL` сессии, поэтому если главный процесс указывает на `https://api.ofox.io/anthropic`, через тот же шлюз идёт каждый вложенный sub-agent. Можно также задать `CLAUDE_CODE_SUBAGENT_MODEL` со значением конкретного ofox model ID, например `anthropic/claude-haiku-4.5`, и одним махом переопределить выбор модели для всех sub-agents.

Claude Code: вложенные sub-agents, 5 уровней, математика токенов и 3 ловушки (2026)

Бо́льшую часть 2026 года в документации Claude Code висело жёсткое правило: «sub-agents не могут запускать других sub-agents». Намеренное ограждение от бесконечной рекурсии. 10 июня правило тихо сломалось — в v2.1.172 в changelog появилась одна строка: sub-agents теперь могут вкладываться, до 5 уровней вглубь.

Фича настолько свежая, что официальная страница sub-agents всё ещё уверяет: вложенность невозможна. Если вы уже привыкли к одноуровневому делегированию, апгрейд не такой большой — но математика токенов, поверхность настроек и сценарии отказа отличаются от того, к чему привыкли руки. Этот гайд — то, что стоило прочитать до первого вложенного запуска, о котором потом жалеешь.

Что можно делать со вложенными sub-agents (а что нельзя)

Можно	Нельзя
Запускать sub-agents изнутри sub-agent, до 5 уровней вглубь	Пропустить настройку `tools`, `model` или `maxTurns` — defaults наследуются от родителя
Маршрутизировать каждый уровень на свою модель (`opus` → `sonnet` → `haiku`)	Делить контекст между вложенными sub-agents — каждый работает в изолированном окне 200K
Ограничить, кого может запускать sub-agent, через `Agent(name1, name2)`	Остановить родителя, не остановив всех его живых потомков
Описать inline `mcpServers` и `hooks`, которые работают только в течение жизни одного sub-agent	Использовать `EnterPlanMode` или `AskUserQuestion` внутри любого вложенного sub-agent (этим инструментам нужен state главного треда)
Поставить `permissions.deny: ["Agent(name)"]` и глобально заблокировать конкретного sub-agent	Полагаться на официальную страницу sub-agents docs — её ещё не обновили под 2.1.172

Ментальная модель за 30 секунд: вложенные sub-agents — рекурсия с лимитом стека в 5 кадров, каждый кадр со своим system prompt и моделью. Родитель читает только summary листа. Всё, что между, стоит токенов и исчезает.

Когда вкладывать (а когда — нет)

Когда стоит

Работа — дерево, а не список. Верхний reviewer задаёт трём специализированным sub-reviewer (security, perf, style) один и тот же вопрос про один и тот же diff, и у каждого специалиста — свой MCP-сервер или skill preload.
Работа рекурсивна по форме. Прогон по monorepo, где каждую packages/* нужно исследовать со своими конвенциями, а summary листьев свёртывается наверх.
Уже упёрлись в окно контекста на уровне 1. Одноуровневые sub-agents возвращают отчёты по 30K токенов, забивая главный разговор; ещё один уровень вниз позволит каждому листу сначала сжать, а потом отдать.

Когда НЕ стоит

Работа — последовательность. Пять шагов с зависимостями — это один sub-agent с maxTurns: 20, а не пять вложенных вызовов. Каждый слой — необратимое разделение контекста и одна запись system prompt.
Хочется параллельных воркеров, которые общаются между собой. Это agent teams, а не вложенность. Вложенные sub-agents общаются только вверх и вниз, никогда не вбок.
Лист дёрнет всего один tool. На этом этапе вы платите целый system prompt за один Read или Grep. Вызовите инструмент прямо из родителя.

Stop rule

Перед вложенностью напишите на стикере ожидаемый summary листа. Если это меньше ~500 токенов или родитель мог бы выдать то же самое двумя tool-вызовами — не вкладывайте. Вложенность окупается, когда лист делает осмысленную работу и возвращает осмысленно сжатый ответ.

Требования к системе

Требование	Чем проверить
Claude Code v2.1.172 или новее	`claude --version`
Инструмент `Agent` присутствует в `tools` родительского sub-agent (allowlist)	`cat .claude/agents/<parent>.md \| grep -i agent`
Доступ к Anthropic API ИЛИ совместимый шлюз вроде ofox.ai	`echo $ANTHROPIC_BASE_URL`
Хотя бы один дочерний sub-agent в `.claude/agents/` или `~/.claude/agents/`	`ls -1 .claude/agents/ ~/.claude/agents/ 2>/dev/null`

Если у вас 2.1.171 или ниже — npm i -g @anthropic-ai/claude-code. CLI печатает разрешённую версию при запуске; старые версии молча игнорируют вложенные вызовы и обрабатывают внутренний Agent tool use как обычный Read.

Пошагово: настраиваем цепочку вложенных sub-agents

Пример строит трёхуровневую цепочку: верхний triage-lead классифицирует входящий баг-репорт, делегирует repro-runner для подтверждения воспроизводимости, тот в свою очередь делегирует log-summariser сжатие сырых логов контейнера в 200-строчный summary.

Шаг 1: лист

Создайте .claude/agents/log-summariser.md:

---
name: log-summariser
description: Reads raw container logs and returns a structured summary of errors, timing, and suspicious patterns.
tools: Read, Grep
model: haiku
maxTurns: 8
---

You are a log summariser. Given a path to a log file, return:
1. Top 5 distinct error signatures with frequency
2. Earliest and latest timestamps observed
3. Any panic, OOM, or segfault entries with line numbers
Return strictly Markdown — no preamble.

Ожидаемый результат: файл подхватится сразу, если создавать через /agents, или при следующем старте сессии, если редактировать на диске.

Шаг 2: средний уровень

Создайте .claude/agents/repro-runner.md:

---
name: repro-runner
description: Reproduces a bug from a description, captures logs, and returns whether the failure is deterministic.
tools: Agent(log-summariser), Read, Bash
model: sonnet
maxTurns: 12
---

You reproduce bugs. Run the failing command, capture logs to /tmp/repro.log,
then call the log-summariser sub-agent to compress the output before returning.
Report: deterministic? yes/no, plus the summary.

Поле tools: Agent(log-summariser) — это и есть новизна. До 2.1.172 Agent(...) внутри определения sub-agent не имел никакого эффекта. Теперь это allowlist того, что данный sub-agent имеет право запускать.

Шаг 3: корень

Создайте .claude/agents/triage-lead.md:

---
name: triage-lead
description: Triages incoming bug reports end-to-end — classification, reproduction, log review.
tools: Agent(repro-runner), Read, Grep, Bash
model: opus
maxTurns: 15
---

Classify the bug (P0/P1/P2), delegate reproduction to repro-runner, then
return a triage memo with severity, repro status, and the summarised logs.

Цепочка теперь такая: главная сессия → triage-lead (Opus) → repro-runner (Sonnet) → log-summariser (Haiku). Три уровня.

Шаг 4: запуск из главной сессии

> Use the triage-lead agent on the bug report at ./bugs/2026-06-11-checkout-500.md

Claude читает поля description и автоматически прогоняет по цепочке. Можно и принудительно: Use triage-lead. Каждый handoff появляется отдельной панелью в /agents, с индикатором глубины.

Шаг 5: проверяем, что вложенность реально случилась

После прогона смотрим /agents (вкладка Running) или прокручиваем транскрипт в поисках трёх отдельных панелей sub-agent. Если видна только одна — родитель воспринял вызов Agent(...) как обычный tool-вызов. Почти всегда это несовпадение версии. Перепроверьте claude --version, нужно 2.1.172+.

/agents
> [Running]
>   triage-lead         opus       depth 1   ✓ completed
>     repro-runner      sonnet     depth 2   ✓ completed
>       log-summariser  haiku      depth 3   ✓ completed

Глубина 3 — нижний порог «работает». Лимит в 5 уровней — это потолок стека, а не цель. Большинство полезных цепочек живут на глубине 2-3.

Типовые ошибки при вложенности (и как чинить)

Симптом	Вероятная причина	Быстрое решение
Инструмент `Agent` отсутствует в доступных инструментах sub-agent	Поведение до 2.1.172 или `Agent` не вписан в `tools` родителя	Обновите Claude Code и добавьте `Agent(child-name)` в `tools` родителя
Sub-agent запускает ребёнка, но у ребёнка нет MCP-серверов, которые были у родителя	MCP-серверы не наследуются через вложенность — каждый sub-agent подключается заново по своему frontmatter	Добавьте имя сервера в `mcpServers` ребёнка или поднимите в user-level `settings.json`
`Agent(x)` игнорируется даже после апгрейда	Ограничение применено в определении sub-agent из плагина (security policy вырезает `permissionMode`/`hooks`/`mcpServers` у plugin-агентов)	Скопируйте файл агента в `.claude/agents/` или `~/.claude/agents/`, не оставляйте в плагине
Вложенный sub-agent доходит до 6 уровня и молча останавливается	Достигнут лимит рекурсии в 5 уровней; вызов 6-го уровня в некоторых транскриптах падает молча	Refactor: либо схлопните один уровень, либо разбейте работу на два корневых вызова
Родитель отчитывается как «completed», а ребёнок остаётся в «active»	Самый частый вариант пофикшен в 2.1.172; всё ещё может всплывать на фоновых sub-agents	Обновитесь до 2.1.172+ или убейте ребёнка через вкладку Running в `/agents` и перезапустите
Счёт за токены взлетает в 7-12 раз без видимого изменения поведения	Каждый вложенный уровень — лишняя запись system prompt; модель по умолчанию наследует главную сессию (для многих это Opus)	Поставьте `CLAUDE_CODE_SUBAGENT_MODEL=haiku`, чтобы все sub-agents без явного override шли на Haiku, потом повышайте per-agent

Третья строка — самая болезненная для команд. Changelog v2.1.172 явно отмечает фикс для фоновых sub-agents, которые залипали в active после остановки вложенного ребёнка — если вы продолжаете сессию, начатую на старой версии, один раз стартуйте с нуля, чтобы сбросить унаследованный state.

Математика токенов: почему вложенность стоит ~7× на ветку

Это расчёт, который решает, оправдан ли подход. Однопоточная сессия Claude Code переиспользует один закэшированный system prompt между ходами. Sub-agent работает в собственном окне контекста с собственным system prompt (меньше, чем у главной сессии, но не бесплатным). Вложите это — и платите ту же overhead на каждой глубине.

Глубина	Что пишется	Что переиспользуется	Прибл. overhead на вызов
0 (главная)	Главный system prompt + tools + CLAUDE.md	Да (кэшируется между ходами)	Базовая линия
1 (sub-agent)	System prompt sub-agent + список инструментов + описание задачи	Частично — список инструментов кэшируется внутри ветки	+30-60% к базе
2 (вложенный)	Prompt внутреннего sub-agent + список инструментов + описание задачи из summary родителя	Ниже — каждый ребёнок переписывает свежий префикс	+30-60% поверх уровня 1
3-5 (глубокая вложенность)	Та же форма, нарастающим итогом	Стремится к нулю — префикс каждого листа короткоживущий	Накопительно ~5-7× от однопоточной

Цифра «~7× потребления токенов» из официального гайда по cost management — это канонический худший случай для sub-agent-интенсивных workflow. Вложенность не умножает её безгранично — листовые вызовы делают меньше работы и используют дешёвые модели — но подталкивает к ней всегда, когда дерево широкое.

С этой математикой борются два рычага:

Tiering модели по глубине. Листу редко нужен Opus. Типичный расклад для триаж-цепочки: Opus в корне, Sonnet на уровне 1, Haiku с уровня 2. Цены Opus и Haiku по входным токенам различаются примерно на порядок, поэтому экономия на листовом уровне компаундится по каждому вложенному вызову.
maxTurns на каждом слое. Без него лист может крутиться 30+ ходов, пытаясь «быть полезным». Ставьте на листья 8, на средние уровни 12; в основном вы не упрётесь, а когда упёрлись — это сигнал, что задача поставлена неверно.

Более глубокую модель издержек на сессиях Claude Code см. в гайде по оптимизации токенов. Его разбор cache_read_input_tokens применим к каждой ветке sub-agent, а не только к главному треду.

3 антипаттерна, которые разносят бюджет

Антипаттерн 1: бесконтрольная вложенность через универсальную рекурсию

Путь наименьшего сопротивления — дать каждому sub-agent tools: Agent (allowlist без ограничений) и позволить модели самой решать, кого запускать. Через несколько часов вы увидите транскрипт, где triage agent запустил «универсального researcher», который запустил «investigation specialist», который запустил «log reader», который запустил… снова универсального researcher. Каждый слой добавляет токены. Лимит глубины 5 спасает от бесконечных циклов, но не спасает от счёта.

Чинить: всегда явный allowlist. tools: Agent(repro-runner, log-summariser) — контракт между sub-agent и его детьми. Если модель не справляется с задачей через этих детей — неверно описана задача, чините описание, а не расширяйте allowlist.

Антипаттерн 2: Opus везде

Дефолт «каждый sub-agent на модели главной сессии» — это default, и для многоуровневого дерева он ровно неверен. Opus в корне оправдан (вы делаете синтез). Opus на листе, который читает лог-файл и считает частоты ошибок, — это оплата топового тарифа за работу, с которой Haiku справляется за долю цены.

Чинить: ставьте CLAUDE_CODE_SUBAGENT_MODEL=haiku на уровне shell, чтобы каждый sub-agent без override получал Haiku. Дальше повышайте только тех, кому нужно больше — обычно это корень и уровень 1. Подход к выбору модели под задачу разбирает гайд по hybrid routing pattern в Claude Code.

Антипаттерн 3: untyped Agent allowlist в production-файлах sub-agent

Проектные sub-agent файлы коммитятся в git. tools: Agent без скобок работает в разработке и выглядит обманчиво безобидно — но коллега, добавивший новый migration-runner через месяц, молча даст существующей триаж-цепочке право запускать его, потому что allowlist принимает всё.

Чинить: явно якорите allowlist в файле: tools: Agent(repro-runner, log-summariser), Read, Grep, Bash. Любое изменение этого списка обрабатывайте как security review — так же, как смену permissions.allow. Более общий принцип — в гайде по безопасности Claude Code: каждое поле, смежное с разрешениями, — это граница безопасности.

Конфигурация для команды / много разработчиков

Командам, гоняющим общие настройки Claude Code по многим репозиториям, три конвенции держат вложенные sub-agents дешёвыми, предсказуемыми и обозримыми:

Конвенция	Где задавать	Почему важно
`CLAUDE_CODE_SUBAGENT_MODEL=haiku` в общем shell rc	Per-developer dotfiles	Закрывает по дефолту утечку «Opus везде»; кому нужен Sonnet/Opus — override per file
Все общие sub-agents коммитятся в `.claude/agents/` с явными `Agent(name1, name2)` allowlist	Per-repo	Code review видит изменения вложенности; новые sub-agents не получают auto-grant
`permissions.deny: ["Agent(general-purpose)"]` для проектов с активной вложенностью	`.claude/settings.json`	Принуждает к специализированному делегированию; блокирует антипаттерн рекурсии

Для организаций со стандартизацией по многим репам также стоит подумать о dotfiles-управляемой директории ~/.claude/agents/ с кросс-проектными агентами (review, security, doc-summariser). User-level определения выигрывают у project-level только когда проект не переобъявляет то же имя, поэтому конвенция: «общее — в user scope, repo-specific — в project scope».

Продвинутое: маршрутизация разных уровней на разные модели через ofox

Переменная CLAUDE_CODE_SUBAGENT_MODEL применяется к каждому sub-agent, который не задал собственный model. При направлении на Anthropic-совместимый шлюз одна эта переменная пересаживает весь leaf-уровень с одного model alias на другой, не трогая ни одного sub-agent файла. Интеграция — одна переменная окружения плюс model alias:

export ANTHROPIC_BASE_URL=https://api.ofox.io/anthropic
export ANTHROPIC_API_KEY=<your_ofox_key>
export CLAUDE_CODE_SUBAGENT_MODEL=haiku

claude

Sub-agents любой глубины, не override-ящие model, теперь идут через ofox на Haiku. Корневой агент и любой sub-agent, явно задавший model: opus или model: sonnet, всё равно идёт через ofox на соответствующий tier — CLAUDE_CODE_SUBAGENT_MODEL это default, а не override. Полную настройку, включая то, как cache_control headers проходят без изменений и экономят на prompt caching у родителя, разбирает гайд по подключению Claude Code к ofox.

Ofox принимает и голые алиасы Claude Code (opus, sonnet, haiku), и явные ID с префиксом провайдера (anthropic/claude-opus-4.8, anthropic/claude-sonnet-4.6, anthropic/claude-haiku-4.5), которые писали бы при прямой интеграции. Алиасы держат frontmatter sub-agent переносимым между прямой Anthropic и шлюзом; явные ID фиксируют конкретную версию. Витрина моделей на ofox.ai/models показывает текущую линейку Claude — можно прикинуть фактический счёт под свою ярусную схему до того, как commit-ить.

Для очень длинных вложенных прогонов следующим ограничением становится дефолтный TTL prompt cache в 5 минут. ENABLE_PROMPT_CACHING_1H=1 растягивает его до часа за 2× к стоимости cache-write — обычно окупается, когда одна triage-цепочка переваливает за 15 минут wall clock.

Источники

Claude Code CHANGELOG v2.1.172: github.com/anthropics/claude-code/blob/main/CHANGELOG.md
Справочник Claude Code sub-agents: code.claude.com/docs/en/sub-agents
Гайд Claude Code по cost management: code.claude.com/docs/en/costs
Зеркало changelog Claude Code: code.claude.com/docs/en/changelog
Снимок витрины моделей ofox: ofox.ai/models

Заголовок — «5 уровней вглубь», но полезное число — «глубина 2». Большинство вложенных цепочек окупаются на root-Opus, mid-Sonnet, leaf-Haiku — три уровня, три модельных tier, один явный Agent(name) allowlist на каждом handoff. Пропустите allowlist или tiering — и лимит в 5 уровней превращается из первой линии обороны в последнюю линию обороны кошелька.