Claude Sonnet 5 vs Opus 4.8 (2026): на бумаге на 60% дешевле

Q: Claude Sonnet 5 лучше, чем Opus 4.8?

Не по всем фронтам. Opus 4.8 по-прежнему впереди в двух самых тяжёлых строках по программированию и рассуждениям: SWE-bench Pro 69,2% против 63,2% у Sonnet 5, а разрыв в рассуждениях без инструментов — около 6,6 пункта. Sonnet 5 чуть опережает в интеллектуальной работе (GDPval-AA v2: 1 618 против 1 615) и уверенно выигрывает по цене. Для большинства профессиональных задач Sonnet 5 — лучший выбор по умолчанию; Opus 4.8 отрабатывает свою наценку на самых сложных 10–20% задач.

Q: Насколько Claude Sonnet 5 дешевле Opus 4.8?

По вводным ценам ($2/$10 за миллион входных/выходных токенов до 31 августа 2026 года) Sonnet 5 на 60% дешевле $5/$25 у Opus 4.8. После 31 августа стандартная ставка — $3/$15, это на 40% дешевле Opus. Кешированный вход стоит $0.2/M на Sonnet 5 против $0.5/M на Opus — тоже на 60% дешевле. Это ставки за токен; итоговый счёт за задачу зависит от того, сколько токенов каждая модель реально выдаёт.

Q: Использует ли Claude Sonnet 5 новый токенизатор?

Да. В документации Anthropic сказано, что Sonnet 5 использует новый токенизатор, который на тот же текст выдаёт примерно на 30% больше токенов, чем Sonnet 4.6 (замеры сообщества дают разброс 1.0–1.35x). Это не изменение API, так что править код не нужно, но счётчики токенов, вместимость контекстного окна по тексту и бюджеты max_tokens смещаются. Если вы мигрируете с Sonnet 4.6, пересчитайте промпты, прежде чем доверять старым бюджетам.

Q: Почему Claude Sonnet 5 обходится дороже за задачу, чем подсказывает цена?

Две причины. Адаптивное мышление на Sonnet 5 включено по умолчанию, поэтому на задачу приходится больше выходных и thinking-токенов, чем на вызов Sonnet 4.6 без мышления. И выход тарифицируется по более высокой ставке. Независимая оценка стоимости прогона от Artificial Analysis дала для Sonnet 5 примерно $2.29 за задачу — вдвое больше Sonnet 4.6 и примерно на 15% выше Opus 4.8 в их агентной оценке. На агентных прогонах с большим объёмом выхода скидка с ценника может съёжиться до нуля или уйти в минус.

Q: Подходит ли Claude Sonnet 5 для программирования?

Да, для большинства задач. Он набирает 63,2% в SWE-bench Pro против 58,1% у Sonnet 4.6 и является самой агентной моделью Anthropic в классе Sonnet. Для рутинной работы над фичами, рефакторингов и ответов на базе RAG это экономичный выбор. Для самых сложных сквозных агентных задач 69,2% у Opus 4.8 и более сильные длинные рассуждения по-прежнему оправдывают маршрутизацию тяжёлого на него.

Q: Стоит ли переходить с Opus 4.8 на Sonnet 5?

Переведите высокообъёмную часть с ограниченным выходом (классификация, извлечение, чат, короткие правки кода) — и сократите этот счёт на 40–60%. Оставьте Opus 4.8 для самых сложных агентных задач и рассуждений. Прагматичный паттерн — это маршрутизация, а не замена: дешёвую ограниченную работу на Sonnet 5, тяжёлую и длинную — на Opus 4.8, обе за одним эндпоинтом.

Q: Каков размер контекстного окна Claude Sonnet 5?

1M токенов — то же номинальное окно, что и у Opus 4.8, при 128K максимальных выходных токенов. Одна оговорка: поскольку новый токенизатор упаковывает меньше текста на токен, окно в 1M токенов на Sonnet 5 вмещает меньше фактического текста, чем то же окно на Sonnet 4.6. Число одинаковое; вместимость по тексту меньше.

Q: Можно ли задать temperature на Claude Sonnet 5?

Нет. Установка temperature, top_p или top_k в недефолтное значение возвращает ошибку 400 на Sonnet 5 — то же ограничение, что Anthropic ввела на Opus 4.7. При миграции удалите эти параметры и управляйте поведением через системный промпт. Ручное расширенное мышление (budget_tokens) тоже возвращает 400; используйте адаптивное мышление с параметром effort.

Коротко 30 июня 2026 года Anthropic выпустила Claude Sonnet 5 по вводной цене $2/$10 за миллион токенов — на 60% ниже $5/$25 у Opus 4.8 (стандартная ставка после 31 августа — $3/$15, всё ещё на 40% ниже). По возможностям Opus 4.8 удерживает две строки, важные для тяжёлой работы: SWE-bench Pro 69,2% против 63,2% и лидерство примерно в 6,6 пункта в рассуждениях без инструментов. Две вещи тихо сокращают ценовой разрыв: новый токенизатор, который считает примерно на 30% больше токенов, чем Sonnet 4.6, и адаптивное мышление, включённое по умолчанию, из-за которого Artificial Analysis оценивает стоимость примерно на 15% выше за агентную задачу, чем у Opus 4.8. Ценник обещает минус 60%. Счёт говорит: «зависит от вашей нагрузки». Ниже — точная арифметика, таблица бенчмарков, два реальных месячных счёта и паттерн маршрутизации, который задействует обе модели.

Claude Sonnet 5 в прайсе на 60% ниже Opus 4.8, но адаптивное мышление и новый токенизатор означают, что агентная нагрузка с большим объёмом выхода может стоить столько же или дороже. Скидка реальна для ограниченного выхода и мнимая для длинных агентных прогонов.

Коротко: что выбрать?

Для большинства команд ответ таков: «Sonnet 5 по умолчанию, Opus 4.8 — для сложного хвоста». Вот однострочный вердикт по сценариям.

Сценарий	Выбор	Почему
Высокообъёмная классификация / извлечение / чат	Sonnet 5	Ограниченный выход, дешевле токены, счёт ниже на 40–60%
Ответы RAG, суммаризация, рутинные правки кода	Sonnet 5	Возможностей хватает; выигрывает цена
Самое сложное сквозное агентное программирование (уровень SWE-bench Pro)	Opus 4.8	69,2% против 63,2%, меньше итераций до решения
Длинные рассуждения без инструментов	Opus 4.8	Лидерство ~6,6 пункта в рассуждениях
Агентные циклы с большим выходом и включённым мышлением	Сначала измерьте	Стоимость задачи у Sonnet 5 может превысить Opus
Экономичный дефолт для смешанной нагрузки	Маршрутизируйте обе	Дешёвую работу на Sonnet 5, тяжёлую — на Opus 4.8

Остальная часть материала — доказательства за этой таблицей, плюс способ в 10 строк, как провести A/B обеих моделей на вашей собственной нагрузке, прежде чем принимать решение.

Краткое сравнение характеристик

Обе модели делят одно и то же номинальное окно контекста в 1M и максимум выхода в 128K. Отличия — в цене, токенизаторе и поведении мышления по умолчанию.

Характеристика	Claude Sonnet 5	Claude Opus 4.8
ID модели в ofox	`anthropic/claude-sonnet-5`	`anthropic/claude-opus-4.8`
Вход (вводная, до 31 авг.)	$2/M	$5/M
Выход (вводная, до 31 авг.)	$10/M	$25/M
Вход (стандарт, после 31 авг.)	$3/M	$5/M
Выход (стандарт, после 31 авг.)	$15/M	$25/M
Чтение кешированного входа	$0.2/M	$0.5/M
Запись в кеш (5 мин / 1 ч)	$2.5 / $4 за M	$6.25 / $10 за M
Контекстное окно	1M токенов	1M токенов
Максимум выхода	128K токенов	128K токенов
Токенизатор	Новый (примерно +30% против Sonnet 4.6)	Токенизатор прошлого поколения
Адаптивное мышление	Включено по умолчанию	Включено по умолчанию

Вводные прайс-цены ($2/$10 и $5/$25) совпадают со страницами моделей ofox для anthropic/claude-sonnet-5 и anthropic/claude-opus-4.8 по состоянию на 1 июля 2026 года; разбивка вводной и стандартной ставок и рубеж 31 августа взяты из официальной документации Anthropic по ценам. Обратите внимание на стандартную ставку выхода: после вводного окна Sonnet 5 садится на $15/M против $25/M у Opus 4.8, так что разрыв по выходу сужается с 60% до 40%.

Ценовой разрыв реален. Вот точная арифметика.

По ставкам за токен Sonnet 5 действительно дешевле, и дешевле по каждой строке: вход, выход и чтение из кеша.

В течение вводного окна (до 31 августа 2026 года) Sonnet 5 стоит $2/$10 против $5/$25 у Opus 4.8. Это минус 60% на входе и минус 60% на выходе. После 31 августа включается стандартная ставка $3/$15, то есть минус 40% по обеим строкам. Чтение кешированного входа — $0.2/M против $0.5/M, срез в 60%, который держится независимо от вводного окна и очень много значит для продакшн-трафика с интенсивным использованием кеша промптов.

Так что если ваша нагрузка доминируется входными токенами и выдаёт короткий, ограниченный выход, Sonnet 5 делает ровно то, что обещает заголовок. Сложным сюжет становится там, где генерируется много выхода, — а это большая часть агентной работы.

Одна строка в таблице характеристик заслуживает большего веса, чем обычно ей дают: кешированный вход. Sonnet 5 читает кешированный вход по $0.2/M против $0.5/M у Opus 4.8. Если ваши промпты несут большой стабильный префикс (системный промпт, схему инструментов, набор извлечённых документов, повторяющийся между вызовами), кеширование промптов — это то место, где лежат настоящие деньги, и чтение из кеша у Sonnet 5 на 60% дешевле независимо от вводного окна. Продакшн-эндпоинт RAG, кеширующий префикс в 20K токенов на тысячах вызовов, платит за этот префикс $0.2/M на Sonnet 5 вместо $0.5/M на Opus 4.8. Подвох — на стороне записи: Sonnet 5 пишет в кеш по $2.5/M (5 минут) или $4/M (1 час) против $6.25 и $10 у Opus 4.8, так что кеширование окупается быстрее на Sonnet 5, но только если частота попаданий достаточно высока, чтобы амортизировать запись. Ниже примерно соотношения чтений к записям 1:1–1.5:1 кеширование обходится дороже, чем экономит, на любой из моделей.

Новый токенизатор и кого он на самом деле затрагивает

Sonnet 5 поставляется с новым токенизатором. Это та часть запуска, которая с наибольшей вероятностью удивит вас в счёте, и она же чаще всего трактуется неверно.

Проверенные факты, прямо из документации Anthropic «What’s new in Sonnet 5»: тот же входной текст даёт примерно на 30% больше токенов на Sonnet 5, чем на Sonnet 4.6. Замеры сообщества дают разброс 1.0–1.35x в зависимости от содержимого. Это не изменение API (запросы, ответы и стриминг сохраняют ту же форму), но это сдвигает всё, что вы считаете в токенах:

Что вы измеряете	Эффект на Sonnet 5 против Sonnet 4.6
Счётчики токенов `usage` для того же текста	Примерно на 30% больше
Текст, вмещающийся в окно 1M	Меньше, потому что каждый токен покрывает меньше текста
Бюджеты выхода `max_tokens`	Могут обрезать выход, рассчитанный под 4.6
Стоимость запроса при той же цене за токен	Выше за тот же текст

Вот ошибочное прочтение, которого стоит избегать: эти 30% измерены против Sonnet 4.6, а не против Opus 4.8. Anthropic ввела этот стиль изменения токенизатора раньше, около Opus 4.7, поэтому Opus 4.8 уже работает на сопоставимом токенизаторе прошлого поколения. Для одного и того же текста Sonnet 5 и Opus 4.8 попадают примерно в один и тот же диапазон по токенам. Токенизатор кусается сильнее всего, когда вы мигрируете с Sonnet 4.6 на Sonnet 5 и повторно используете старые бюджеты токенов, а не когда выбираете между Sonnet 5 и Opus 4.8.

Практический вывод: если вы приходите с Sonnet 4.6, пересчитайте промпты через эндпоинт подсчёта токенов и пересмотрите любые max_tokens, заданные впритык к ожидаемому выходу, прежде чем доверять формуле «та же цена $3/$15». Та же цена за токен, больше токенов, выше счёт. Наше руководство по оптимизации токенов в Claude Code объясняет, как отыграть это назад с помощью кеширования и обрезки промптов.

Бенчмарк по программированию: SWE-bench Pro и реальный разрыв

Бенчмарки по коду шумные, но SWE-bench Pro — тот, о котором стоит спорить, потому что он прогоняется на реальных задачах GitHub от начала до конца. Вот где садятся обе, с Sonnet 4.6 для ориентира.

Бенчмарк	Sonnet 5	Opus 4.8	Sonnet 4.6
SWE-bench Pro (агентное программирование)	63,2%	69,2%	58,1%
GDPval-AA v2 (интеллектуальная работа, Elo)	1 618	1 615	н/д
Рассуждения без инструментов (разрыв)	отстаёт на ~6,6 п.	лидирует	н/д

Значения SWE-bench Pro и GDPval-AA v2 скомпилировал MarkTechPost из материалов запуска Anthropic 30 июня 2026 года; разрыв в рассуждениях без инструментов ~6,6 пункта берётся из System Card Anthropic (через digitalapplied.com и codingfleet.com), а не из MarkTechPost. Относитесь к оценкам в стиле лидербордов как к моментальному снимку и смотрите Transparency Hub Anthropic для источника по каждому бенчмарку. Две вещи в этой таблице решают большинство вопросов маршрутизации.

Opus 4.8 сохраняет отрыв в 6 пунктов по SWE-bench Pro. Sonnet 5 с 63,2% — реальный скачок над 58,1% у Sonnet 4.6, но 69,2% у Opus 4.8 всё ещё та цифра, которую надо превзойти для сложных многофайловых агентных задач. Шесть пунктов в SWE-bench Pro — это разница между «закрывает задачу с первого прогона» и «закрывает после повтора», а на длинных агентных циклах это складывается в расход токенов. Если ваша работа живёт у этого потолка, дешёвая модель на самом деле не дешевле, когда вы считаете повторы.

Sonnet 5 выигрывает интеллектуальную работу на волосок. В лидерборде экономической работы GDPval-AA v2 Sonnet 5 опережает Opus 4.8 на три пункта Elo (1 618 против 1 615). Это внутри шума, но суть остаётся: для общих профессиональных задач, которые не относятся к самому сложному программированию, Sonnet 5 на паритете с моделью, что стоит больше чем вдвое дороже. Собственная формулировка Anthropic: режим повышенного усилия Sonnet 5 может сравняться с Opus 4.8 на части задач, предлагая при этом более широкий диапазон «цена — производительность».

Полезно понимать, что именно измеряют эти два бенчмарка, прежде чем взвешивать их. SWE-bench Pro прогоняет модели против реальных нерешённых задач GitHub от начала до конца: модель читает репозиторий, пишет патч, и патч либо проходит скрытый тестовый набор проекта, либо нет. Частичного зачёта нет — вот почему абсолютные числа выглядят низкими рядом с оценками из вопросов с выбором ответа. GDPval-AA v2 устроен иначе. Он оценивает модели на реальной экономической интеллектуальной работе (составление документов, анализ, структурированные рассуждения) как рейтинг Elo против других моделей, так что отрыв в 3 пункта — это подбрасывание монеты, а отрыв в 100 пунктов — решающий. Вместе таблицы говорят одно ясно: Opus 4.8 заметно лучше закрывает сложные задачи по коду, а Sonnet 5 на паритете в общем профессиональном выводе. В этом весь аргумент в пользу маршрутизации, а не выбора единственного победителя.

Арифметика цен: два реальных месячных счёта

Прайс-цена — одно число. Счёт — другое. Вот две нагрузки, которые приводят к противоположным выводам, с явно указанными допущениями, чтобы вы могли подставить свои.

Сценарий A, высокообъёмный ограниченный выход (бот поддержки, классификация, извлечение). Допустим, 300M входных токенов в месяц, половина из которых отдаётся из кеша, и 30M выходных токенов в месяц.

Строка	Sonnet 5 (вводная)	Sonnet 5 (стандарт)	Opus 4.8
150M свежего входа	$300	$450	$750
150M кешированного входа	$30	$30	$75
30M выхода	$300	$450	$750
Итого в месяц	$630	$930	$1,575
против Opus 4.8	на 60% меньше	на 41% меньше	база

Здесь скидка ровно такая, как обещает заголовок. Ограниченный выход означает, что более дешёвые ставки за токен напрямую перетекают в итоговую сумму.

Сценарий B, агентное программирование (длинные многошаговые прогоны, мышление включено). Допустим, 5 разработчиков, по 25 задач в день каждый, 20 рабочих дней (2 500 задач в месяц). На задачу: 60K входа у обеих. Выход: 12K на Opus 4.8, но около 30K на Sonnet 5, потому что адаптивное мышление включено по умолчанию и он рассуждает больше на задачу.

Строка	Sonnet 5 (вводная)	Sonnet 5 (стандарт)	Opus 4.8
Вход на задачу (60K)	$0.12	$0.18	$0.30
Выход на задачу	$0.30 (30K)	$0.45 (30K)	$0.30 (12K)
Стоимость задачи	$0.42	$0.63	$0.60
В месяц (2 500 задач)	$1,050	$1,575	$1,500
против Opus 4.8	на 30% меньше	на 5% больше	база

По стандартным ценам агентная нагрузка с большим объёмом выхода может стоить немного дороже на Sonnet 5, чем на Opus 4.8, потому что лишние thinking-токены садятся на строку выхода. Моя иллюстративная модель показывает +5%; независимая оценка стоимости прогона от Artificial Analysis ставит её ближе к +15% ($2.29 за задачу против Opus, снимок — конец июня 2026 года). Точное число зависит от того, насколько много ваши задачи «думают». Направление — нет: скидка с ценника не переживает контакта с длинными агентными прогонами. Это самое важное, что нужно усвоить, прежде чем мигрировать парк агентов.

Когда выбирать Claude Sonnet 5

Выбирайте anthropic/claude-sonnet-5, когда выход ограничен, а объём высок. Конкретно:

Классификация, извлечение, маршрутизация, модерация. Короткие выходы, огромный объём входа, часто с интенсивным кешем. $2/$10 у Sonnet 5 и чтение из кеша по $0.2/M срезают эти счета на 40–60%.
Ответы RAG и суммаризация. Извлечение делает основную работу; модель пишет ограниченный ответ. Возможностей с избытком, выигрывает цена.
Рутинное программирование. Правки в одном файле, шаблонный код, каркас тестов, комментарии код-ревью. 63,2% в SWE-bench Pro у Sonnet 5 более чем достаточно для работы, которая не на фронтире.
Чат и ассистентские поверхности. Интерактивные реплики короткие; скорость и цена Sonnet 5 подходят лучше, чем модель класса Opus.

Когда выбирать Claude Opus 4.8

Выбирайте anthropic/claude-opus-4.8, когда задача достаточно сложна, чтобы неверный первый ответ обошёлся дороже разницы в цене:

Фронтирное агентное программирование. Отрыв в 6 пунктов по SWE-bench Pro — это разница между одним прогоном и циклом повторов. На сложных многофайловых задачах Opus 4.8 заканчивает за меньшее число итераций, а меньше итераций — меньше токенов. Мы разбираем модель детально в нашем обзоре выпуска Opus 4.8.
Длинные рассуждения без инструментов. Разрыв в рассуждениях без инструментов ~6,6 пункта проявляется как «план держится» на сложных многошаговых задачах.
Агентные циклы с большим выходом, где вы замерили Sonnet 5 и он вышел вровень или дороже. Если стоимость задачи одинакова в обоих случаях, берите модель с более высоким бенчмарком.

Когда не выбирать ни одну (и что делать вместо этого)

Ловушка — трактовать это как бинарную замену. Большинство продакшн-нагрузок смешанные: много дешёвых вызовов с ограниченным выходом плюс небольшой хвост по-настоящему сложных задач. Загонять всё это на одну модель — значит переплачивать на лёгких 80% или недорабатывать на сложных 20%.

Решение — маршрутизация. Отправляйте ограниченную высокообъёмную работу на Sonnet 5, а сложный хвост — на Opus 4.8, за одним эндпоинтом, чтобы смена модели была изменением одной строки, а не переинтеграцией. Этот паттерн и то, как выбирать сигнал маршрутизации, — в нашем разборе паттерна гибридной маршрутизации Claude Code. Через ofox обе модели сидят на одном OpenAI-совместимом API, так что роутер — это поиск по словарю, а не второй SDK.

Сложная часть маршрутизации — не сантехника, а сигнал: как решить для каждого запроса, тяжёлая ли задача, до того как вы её запустите? На практике работают три сигнала. Длина входа — самый дешёвый прокси, поскольку запросы сверх некоторого порога по токенам обычно оказываются многофайловыми задачами с большим контекстом, которые вознаграждают Opus 4.8. Тег типа задачи из вашего собственного приложения (классификация против открытой агентной работы) точнее, если он у вас уже есть. И проверка уверенности работает как запасной вариант: сначала прогоняйте Sonnet 5, а эскалируйте на Opus 4.8 только тогда, когда выход дешёвой модели не проходит шаг валидации. Паттерн эскалации держит долю Opus малой — в этом и весь смысл, ведь Opus — дорогой ярус, к которому вы хотите обращаться так редко, как позволяет работа.

flowchart TD
    A[Incoming request] --> B{Bounded output?<br/>classification, RAG, chat}
    B -->|Yes| C[anthropic/claude-sonnet-5]
    B -->|No| D{Frontier coding or<br/>long-horizon reasoning?}
    D -->|Yes| E[anthropic/claude-opus-4.8]
    D -->|No, measure it| F[A/B both, pick lower per-task cost]

Попробуйте обе через ofox: A/B в 10 строках

Честный способ закрыть вопрос — прогнать обе на вашей собственной нагрузке и прочитать счётчики токенов. ofox отдаёт обе модели на одном OpenAI-совместимом эндпоинте (https://api.ofox.ai/v1), так что единственное, что меняется между прогонами, — строка ID модели. Один нюанс: Sonnet 5 отклоняет недефолтные temperature, top_p и top_k с ошибкой 400, так что оставьте параметры сэмплинга на значениях по умолчанию (примеры ниже так и делают).

Python: A/B обеих моделей в одном цикле

from openai import OpenAI

client = OpenAI(base_url="https://api.ofox.ai/v1", api_key="YOUR_OFOX_KEY")

prompt = "Refactor this function to remove the nested loop: ..."
for model in ["anthropic/claude-sonnet-5", "anthropic/claude-opus-4.8"]:
    r = client.chat.completions.create(
        model=model,
        messages=[{"role": "user", "content": prompt}],
    )
    u = r.usage
    print(model, u.prompt_tokens, u.completion_tokens)

Читайте completion_tokens для каждой. Этот столбец, умноженный на ставку выхода, — то место, где «более дешёвая» модель может тихо перестать быть дешёвой.

Node: та же форма

import OpenAI from "openai";

const client = new OpenAI({ baseURL: "https://api.ofox.ai/v1", apiKey: process.env.OFOX_KEY });

const prompt = "Refactor this function to remove the nested loop: ...";
for (const model of ["anthropic/claude-sonnet-5", "anthropic/claude-opus-4.8"]) {
  const r = await client.chat.completions.create({
    model,
    messages: [{ role: "user", content: prompt }],
  });
  console.log(model, r.usage.prompt_tokens, r.usage.completion_tokens);
}

Прогоните это на 20–30 репрезентативных задачах, просуммируйте входные и выходные токены по каждой модели и умножьте на ставки из таблицы характеристик. Это число решает вопрос, какую модель куда маршрутизировать, лучше любого бенчмарка. Полную разбивку цен по всей линейке Claude смотрите в нашем руководстве по ценам Claude API.

Подводные камни миграции: что ломается при переходе на Sonnet 5

По форме Sonnet 5 — это drop-in замена Sonnet 4.6, но три изменения в поведении вернут ошибки 400, если ваш старый код рассчитывает на дефолты 4.6. В большинстве случаев это применимо и относительно кода под Opus 4.8.

Изменение	Старое поведение	На Sonnet 5
Параметры сэмплинга	`temperature`/`top_p`/`top_k` принимаются	Недефолтные значения возвращают 400
Ручное расширенное мышление	`budget_tokens` принимался на части моделей	Возвращает 400; используйте адаптивное мышление + `effort`
Мышление по умолчанию	Выключено, если не запрошено (4.6)	Адаптивное мышление включено по умолчанию; передайте `thinking: {type: "disabled"}`, чтобы отключить
Размер `max_tokens`	Настроен под счёт токенов 4.6	Может обрезать; новый токенизатор выдаёт больше токенов

Строка про max_tokens — коварный сбой. Если вы задали бюджеты выхода впритык под Sonnet 4.6, та же генерация на Sonnet 5 выдаёт больше токенов на тот же текст и может упереться в потолок на середине ответа. Поднимите бюджет — иначе будете отгружать обрезанные ответы. Есть и новый предохранитель, о котором стоит знать: Sonnet 5 — первая модель класса Sonnet с отказами по кибербезопасности в реальном времени, которые возвращаются как успешный HTTP 200 с stop_reason: "refusal", а не как ошибка, так что обрабатывайте этот stop reason явно.

Адаптивное мышление — то изменение, что с наибольшей вероятностью сдвинет ваш счёт, и у него есть регулятор. Вместо старой ручки budget_tokens Sonnet 5 выставляет параметр effort (low, medium, high), который меняет глубину рассуждений на расход токенов. Если вы мигрировали нагрузку Opus 4.8, ожидая, что Sonnet 5 будет дешевле, а счёт пришёл ровным, первое, что стоит попробовать, — снизить effort на вызовах, которым не нужны глубокие рассуждения. Высокий effort на вызове классификации — чистая трата, и именно оттуда идёт значительная часть неожиданной стоимости в Сценарии B. Задавайте effort осознанно для каждого маршрута, а не оставляйте каждый вызов на дефолте.

Чистый тест миграции — не оценка в бенчмарке. Это столбец completion_tokens: прогоните обе модели на ваших реальных задачах и позвольте счётчику токенов, а не прайс-листу, решать маршрутизацию.

FAQ

Claude Sonnet 5 лучше, чем Opus 4.8? Не по всем фронтам. Opus 4.8 лидирует в SWE-bench Pro (69,2% против 63,2%) и рассуждениях без инструментов (около 6,6 пункта). Sonnet 5 чуть опережает в интеллектуальной работе (GDPval-AA v2: 1 618 против 1 615) и выигрывает по цене. Sonnet 5 — лучший выбор по умолчанию; Opus 4.8 отрабатывает наценку на самых сложных задачах.

Насколько Claude Sonnet 5 дешевле Opus 4.8? На 60% по вводным ценам ($2/$10 до 31 августа 2026 года), на 40% по стандартной ставке $3/$15 после. Кешированный вход тоже на 60% дешевле ($0.2/M против $0.5/M).

Использует ли Claude Sonnet 5 новый токенизатор? Да, и он выдаёт примерно на 30% больше токенов на тот же текст, чем Sonnet 4.6. Это не изменение API, но пересчитайте промпты и пересмотрите max_tokens, если мигрируете с 4.6.

Почему Claude Sonnet 5 обходится дороже за задачу, чем подсказывает цена? Адаптивное мышление включено по умолчанию, так что на задачу приходится больше выходных токенов. Artificial Analysis оценила примерно $2.29 за задачу — около 15% выше Opus 4.8 в их агентной оценке.

Подходит ли Claude Sonnet 5 для программирования? Да, для большинства задач (63,2% в SWE-bench Pro против 58,1% у Sonnet 4.6). Маршрутизируйте самые сложные агентные задачи на Opus 4.8.

Стоит ли переходить с Opus 4.8 на Sonnet 5? Переведите высокообъёмную часть с ограниченным выходом и сократите этот счёт на 40–60%. Оставьте Opus 4.8 для сложного хвоста. Маршрутизируйте, а не заменяйте.

Каков размер контекстного окна Claude Sonnet 5? 1M токенов, 128K максимум выхода. Из-за нового токенизатора это окно вмещает меньше фактического текста, чем то же окно на Sonnet 4.6.

Можно ли задать temperature на Claude Sonnet 5? Нет. Недефолтные temperature, top_p или top_k возвращают ошибку 400. Удалите их и управляйте через системный промпт.

Проверенные источники

Anthropic, документация «What’s new in Claude Sonnet 5» (токенизатор, изменения поведения, цены), проверено 1 июля 2026 года: https://platform.claude.com/docs/en/about-claude/models/whats-new-sonnet-5
Anthropic, пост о запуске «Introducing Claude Sonnet 5», 30 июня 2026 года: https://www.anthropic.com/news/claude-sonnet-5
Anthropic Transparency Hub (источник по каждому бенчмарку): https://www.anthropic.com/transparency
Компиляция бенчмарков MarkTechPost (только SWE-bench Pro, GDPval-AA v2), 30 июня 2026 года
System Card Anthropic через digitalapplied.com и codingfleet.com (разрыв в рассуждениях без инструментов, ~6,6 пункта)
Оценка стоимости прогона Artificial Analysis ($2.29 за задачу), снимок — конец июня 2026 года
Страницы моделей ofox для anthropic/claude-sonnet-5 и anthropic/claude-opus-4.8 (вводные прайс-цены $2/$10 и $5/$25, контекстное окно), проверено 1 июля 2026 года; разбивка вводной/стандартной ставок и рубеж 31 августа — по документации Anthropic по ценам