Claude Sonnet 5 vs Opus 4.8 (2026): на бумаге на 60% дешевле
Claude Sonnet 5 стоит $2/$10 против $5/$25 у Opus 4.8 — на 60% дешевле. Но отстаёт 63,2% против 69,2% в SWE-bench Pro, а в агентных задачах может выйти дороже Opus. Что выбрать.
Коротко 30 июня 2026 года Anthropic выпустила Claude Sonnet 5 по вводной цене $2/$10 за миллион токенов — на 60% ниже $5/$25 у Opus 4.8 (стандартная ставка после 31 августа — $3/$15, всё ещё на 40% ниже). По возможностям Opus 4.8 удерживает две строки, важные для тяжёлой работы: SWE-bench Pro 69,2% против 63,2% и лидерство примерно в 6,6 пункта в рассуждениях без инструментов. Две вещи тихо сокращают ценовой разрыв: новый токенизатор, который считает примерно на 30% больше токенов, чем Sonnet 4.6, и адаптивное мышление, включённое по умолчанию, из-за которого Artificial Analysis оценивает стоимость примерно на 15% выше за агентную задачу, чем у Opus 4.8. Ценник обещает минус 60%. Счёт говорит: «зависит от вашей нагрузки». Ниже — точная арифметика, таблица бенчмарков, два реальных месячных счёта и паттерн маршрутизации, который задействует обе модели.
Claude Sonnet 5 в прайсе на 60% ниже Opus 4.8, но адаптивное мышление и новый токенизатор означают, что агентная нагрузка с большим объёмом выхода может стоить столько же или дороже. Скидка реальна для ограниченного выхода и мнимая для длинных агентных прогонов.
Коротко: что выбрать?
Для большинства команд ответ таков: «Sonnet 5 по умолчанию, Opus 4.8 — для сложного хвоста». Вот однострочный вердикт по сценариям.
| Сценарий | Выбор | Почему |
|---|---|---|
| Высокообъёмная классификация / извлечение / чат | Sonnet 5 | Ограниченный выход, дешевле токены, счёт ниже на 40–60% |
| Ответы RAG, суммаризация, рутинные правки кода | Sonnet 5 | Возможностей хватает; выигрывает цена |
| Самое сложное сквозное агентное программирование (уровень SWE-bench Pro) | Opus 4.8 | 69,2% против 63,2%, меньше итераций до решения |
| Длинные рассуждения без инструментов | Opus 4.8 | Лидерство ~6,6 пункта в рассуждениях |
| Агентные циклы с большим выходом и включённым мышлением | Сначала измерьте | Стоимость задачи у Sonnet 5 может превысить Opus |
| Экономичный дефолт для смешанной нагрузки | Маршрутизируйте обе | Дешёвую работу на Sonnet 5, тяжёлую — на Opus 4.8 |
Остальная часть материала — доказательства за этой таблицей, плюс способ в 10 строк, как провести A/B обеих моделей на вашей собственной нагрузке, прежде чем принимать решение.
Краткое сравнение характеристик
Обе модели делят одно и то же номинальное окно контекста в 1M и максимум выхода в 128K. Отличия — в цене, токенизаторе и поведении мышления по умолчанию.
| Характеристика | Claude Sonnet 5 | Claude Opus 4.8 |
|---|---|---|
| ID модели в ofox | anthropic/claude-sonnet-5 | anthropic/claude-opus-4.8 |
| Вход (вводная, до 31 авг.) | $2/M | $5/M |
| Выход (вводная, до 31 авг.) | $10/M | $25/M |
| Вход (стандарт, после 31 авг.) | $3/M | $5/M |
| Выход (стандарт, после 31 авг.) | $15/M | $25/M |
| Чтение кешированного входа | $0.2/M | $0.5/M |
| Запись в кеш (5 мин / 1 ч) | $2.5 / $4 за M | $6.25 / $10 за M |
| Контекстное окно | 1M токенов | 1M токенов |
| Максимум выхода | 128K токенов | 128K токенов |
| Токенизатор | Новый (примерно +30% против Sonnet 4.6) | Токенизатор прошлого поколения |
| Адаптивное мышление | Включено по умолчанию | Включено по умолчанию |
Вводные прайс-цены ($2/$10 и $5/$25) совпадают со страницами моделей ofox для anthropic/claude-sonnet-5 и anthropic/claude-opus-4.8 по состоянию на 1 июля 2026 года; разбивка вводной и стандартной ставок и рубеж 31 августа взяты из официальной документации Anthropic по ценам. Обратите внимание на стандартную ставку выхода: после вводного окна Sonnet 5 садится на $15/M против $25/M у Opus 4.8, так что разрыв по выходу сужается с 60% до 40%.
Ценовой разрыв реален. Вот точная арифметика.
По ставкам за токен Sonnet 5 действительно дешевле, и дешевле по каждой строке: вход, выход и чтение из кеша.
В течение вводного окна (до 31 августа 2026 года) Sonnet 5 стоит $2/$10 против $5/$25 у Opus 4.8. Это минус 60% на входе и минус 60% на выходе. После 31 августа включается стандартная ставка $3/$15, то есть минус 40% по обеим строкам. Чтение кешированного входа — $0.2/M против $0.5/M, срез в 60%, который держится независимо от вводного окна и очень много значит для продакшн-трафика с интенсивным использованием кеша промптов.
Так что если ваша нагрузка доминируется входными токенами и выдаёт короткий, ограниченный выход, Sonnet 5 делает ровно то, что обещает заголовок. Сложным сюжет становится там, где генерируется много выхода, — а это большая часть агентной работы.
Одна строка в таблице характеристик заслуживает большего веса, чем обычно ей дают: кешированный вход. Sonnet 5 читает кешированный вход по $0.2/M против $0.5/M у Opus 4.8. Если ваши промпты несут большой стабильный префикс (системный промпт, схему инструментов, набор извлечённых документов, повторяющийся между вызовами), кеширование промптов — это то место, где лежат настоящие деньги, и чтение из кеша у Sonnet 5 на 60% дешевле независимо от вводного окна. Продакшн-эндпоинт RAG, кеширующий префикс в 20K токенов на тысячах вызовов, платит за этот префикс $0.2/M на Sonnet 5 вместо $0.5/M на Opus 4.8. Подвох — на стороне записи: Sonnet 5 пишет в кеш по $2.5/M (5 минут) или $4/M (1 час) против $6.25 и $10 у Opus 4.8, так что кеширование окупается быстрее на Sonnet 5, но только если частота попаданий достаточно высока, чтобы амортизировать запись. Ниже примерно соотношения чтений к записям 1:1–1.5:1 кеширование обходится дороже, чем экономит, на любой из моделей.
Новый токенизатор и кого он на самом деле затрагивает
Sonnet 5 поставляется с новым токенизатором. Это та часть запуска, которая с наибольшей вероятностью удивит вас в счёте, и она же чаще всего трактуется неверно.
Проверенные факты, прямо из документации Anthropic «What’s new in Sonnet 5»: тот же входной текст даёт примерно на 30% больше токенов на Sonnet 5, чем на Sonnet 4.6. Замеры сообщества дают разброс 1.0–1.35x в зависимости от содержимого. Это не изменение API (запросы, ответы и стриминг сохраняют ту же форму), но это сдвигает всё, что вы считаете в токенах:
| Что вы измеряете | Эффект на Sonnet 5 против Sonnet 4.6 |
|---|---|
Счётчики токенов usage для того же текста | Примерно на 30% больше |
| Текст, вмещающийся в окно 1M | Меньше, потому что каждый токен покрывает меньше текста |
Бюджеты выхода max_tokens | Могут обрезать выход, рассчитанный под 4.6 |
| Стоимость запроса при той же цене за токен | Выше за тот же текст |
Вот ошибочное прочтение, которого стоит избегать: эти 30% измерены против Sonnet 4.6, а не против Opus 4.8. Anthropic ввела этот стиль изменения токенизатора раньше, около Opus 4.7, поэтому Opus 4.8 уже работает на сопоставимом токенизаторе прошлого поколения. Для одного и того же текста Sonnet 5 и Opus 4.8 попадают примерно в один и тот же диапазон по токенам. Токенизатор кусается сильнее всего, когда вы мигрируете с Sonnet 4.6 на Sonnet 5 и повторно используете старые бюджеты токенов, а не когда выбираете между Sonnet 5 и Opus 4.8.
Практический вывод: если вы приходите с Sonnet 4.6, пересчитайте промпты через эндпоинт подсчёта токенов и пересмотрите любые max_tokens, заданные впритык к ожидаемому выходу, прежде чем доверять формуле «та же цена $3/$15». Та же цена за токен, больше токенов, выше счёт. Наше руководство по оптимизации токенов в Claude Code объясняет, как отыграть это назад с помощью кеширования и обрезки промптов.
Бенчмарк по программированию: SWE-bench Pro и реальный разрыв
Бенчмарки по коду шумные, но SWE-bench Pro — тот, о котором стоит спорить, потому что он прогоняется на реальных задачах GitHub от начала до конца. Вот где садятся обе, с Sonnet 4.6 для ориентира.
| Бенчмарк | Sonnet 5 | Opus 4.8 | Sonnet 4.6 |
|---|---|---|---|
| SWE-bench Pro (агентное программирование) | 63,2% | 69,2% | 58,1% |
| GDPval-AA v2 (интеллектуальная работа, Elo) | 1 618 | 1 615 | н/д |
| Рассуждения без инструментов (разрыв) | отстаёт на ~6,6 п. | лидирует | н/д |
Значения SWE-bench Pro и GDPval-AA v2 скомпилировал MarkTechPost из материалов запуска Anthropic 30 июня 2026 года; разрыв в рассуждениях без инструментов ~6,6 пункта берётся из System Card Anthropic (через digitalapplied.com и codingfleet.com), а не из MarkTechPost. Относитесь к оценкам в стиле лидербордов как к моментальному снимку и смотрите Transparency Hub Anthropic для источника по каждому бенчмарку. Две вещи в этой таблице решают большинство вопросов маршрутизации.
Opus 4.8 сохраняет отрыв в 6 пунктов по SWE-bench Pro. Sonnet 5 с 63,2% — реальный скачок над 58,1% у Sonnet 4.6, но 69,2% у Opus 4.8 всё ещё та цифра, которую надо превзойти для сложных многофайловых агентных задач. Шесть пунктов в SWE-bench Pro — это разница между «закрывает задачу с первого прогона» и «закрывает после повтора», а на длинных агентных циклах это складывается в расход токенов. Если ваша работа живёт у этого потолка, дешёвая модель на самом деле не дешевле, когда вы считаете повторы.
Sonnet 5 выигрывает интеллектуальную работу на волосок. В лидерборде экономической работы GDPval-AA v2 Sonnet 5 опережает Opus 4.8 на три пункта Elo (1 618 против 1 615). Это внутри шума, но суть остаётся: для общих профессиональных задач, которые не относятся к самому сложному программированию, Sonnet 5 на паритете с моделью, что стоит больше чем вдвое дороже. Собственная формулировка Anthropic: режим повышенного усилия Sonnet 5 может сравняться с Opus 4.8 на части задач, предлагая при этом более широкий диапазон «цена — производительность».
Полезно понимать, что именно измеряют эти два бенчмарка, прежде чем взвешивать их. SWE-bench Pro прогоняет модели против реальных нерешённых задач GitHub от начала до конца: модель читает репозиторий, пишет патч, и патч либо проходит скрытый тестовый набор проекта, либо нет. Частичного зачёта нет — вот почему абсолютные числа выглядят низкими рядом с оценками из вопросов с выбором ответа. GDPval-AA v2 устроен иначе. Он оценивает модели на реальной экономической интеллектуальной работе (составление документов, анализ, структурированные рассуждения) как рейтинг Elo против других моделей, так что отрыв в 3 пункта — это подбрасывание монеты, а отрыв в 100 пунктов — решающий. Вместе таблицы говорят одно ясно: Opus 4.8 заметно лучше закрывает сложные задачи по коду, а Sonnet 5 на паритете в общем профессиональном выводе. В этом весь аргумент в пользу маршрутизации, а не выбора единственного победителя.
Арифметика цен: два реальных месячных счёта
Прайс-цена — одно число. Счёт — другое. Вот две нагрузки, которые приводят к противоположным выводам, с явно указанными допущениями, чтобы вы могли подставить свои.
Сценарий A, высокообъёмный ограниченный выход (бот поддержки, классификация, извлечение). Допустим, 300M входных токенов в месяц, половина из которых отдаётся из кеша, и 30M выходных токенов в месяц.
| Строка | Sonnet 5 (вводная) | Sonnet 5 (стандарт) | Opus 4.8 |
|---|---|---|---|
| 150M свежего входа | $300 | $450 | $750 |
| 150M кешированного входа | $30 | $30 | $75 |
| 30M выхода | $300 | $450 | $750 |
| Итого в месяц | $630 | $930 | $1,575 |
| против Opus 4.8 | на 60% меньше | на 41% меньше | база |
Здесь скидка ровно такая, как обещает заголовок. Ограниченный выход означает, что более дешёвые ставки за токен напрямую перетекают в итоговую сумму.
Сценарий B, агентное программирование (длинные многошаговые прогоны, мышление включено). Допустим, 5 разработчиков, по 25 задач в день каждый, 20 рабочих дней (2 500 задач в месяц). На задачу: 60K входа у обеих. Выход: 12K на Opus 4.8, но около 30K на Sonnet 5, потому что адаптивное мышление включено по умолчанию и он рассуждает больше на задачу.
| Строка | Sonnet 5 (вводная) | Sonnet 5 (стандарт) | Opus 4.8 |
|---|---|---|---|
| Вход на задачу (60K) | $0.12 | $0.18 | $0.30 |
| Выход на задачу | $0.30 (30K) | $0.45 (30K) | $0.30 (12K) |
| Стоимость задачи | $0.42 | $0.63 | $0.60 |
| В месяц (2 500 задач) | $1,050 | $1,575 | $1,500 |
| против Opus 4.8 | на 30% меньше | на 5% больше | база |
По стандартным ценам агентная нагрузка с большим объёмом выхода может стоить немного дороже на Sonnet 5, чем на Opus 4.8, потому что лишние thinking-токены садятся на строку выхода. Моя иллюстративная модель показывает +5%; независимая оценка стоимости прогона от Artificial Analysis ставит её ближе к +15% ($2.29 за задачу против Opus, снимок — конец июня 2026 года). Точное число зависит от того, насколько много ваши задачи «думают». Направление — нет: скидка с ценника не переживает контакта с длинными агентными прогонами. Это самое важное, что нужно усвоить, прежде чем мигрировать парк агентов.
Когда выбирать Claude Sonnet 5
Выбирайте anthropic/claude-sonnet-5, когда выход ограничен, а объём высок. Конкретно:
- Классификация, извлечение, маршрутизация, модерация. Короткие выходы, огромный объём входа, часто с интенсивным кешем. $2/$10 у Sonnet 5 и чтение из кеша по $0.2/M срезают эти счета на 40–60%.
- Ответы RAG и суммаризация. Извлечение делает основную работу; модель пишет ограниченный ответ. Возможностей с избытком, выигрывает цена.
- Рутинное программирование. Правки в одном файле, шаблонный код, каркас тестов, комментарии код-ревью. 63,2% в SWE-bench Pro у Sonnet 5 более чем достаточно для работы, которая не на фронтире.
- Чат и ассистентские поверхности. Интерактивные реплики короткие; скорость и цена Sonnet 5 подходят лучше, чем модель класса Opus.
Когда выбирать Claude Opus 4.8
Выбирайте anthropic/claude-opus-4.8, когда задача достаточно сложна, чтобы неверный первый ответ обошёлся дороже разницы в цене:
- Фронтирное агентное программирование. Отрыв в 6 пунктов по SWE-bench Pro — это разница между одним прогоном и циклом повторов. На сложных многофайловых задачах Opus 4.8 заканчивает за меньшее число итераций, а меньше итераций — меньше токенов. Мы разбираем модель детально в нашем обзоре выпуска Opus 4.8.
- Длинные рассуждения без инструментов. Разрыв в рассуждениях без инструментов ~6,6 пункта проявляется как «план держится» на сложных многошаговых задачах.
- Агентные циклы с большим выходом, где вы замерили Sonnet 5 и он вышел вровень или дороже. Если стоимость задачи одинакова в обоих случаях, берите модель с более высоким бенчмарком.
Когда не выбирать ни одну (и что делать вместо этого)
Ловушка — трактовать это как бинарную замену. Большинство продакшн-нагрузок смешанные: много дешёвых вызовов с ограниченным выходом плюс небольшой хвост по-настоящему сложных задач. Загонять всё это на одну модель — значит переплачивать на лёгких 80% или недорабатывать на сложных 20%.
Решение — маршрутизация. Отправляйте ограниченную высокообъёмную работу на Sonnet 5, а сложный хвост — на Opus 4.8, за одним эндпоинтом, чтобы смена модели была изменением одной строки, а не переинтеграцией. Этот паттерн и то, как выбирать сигнал маршрутизации, — в нашем разборе паттерна гибридной маршрутизации Claude Code. Через ofox обе модели сидят на одном OpenAI-совместимом API, так что роутер — это поиск по словарю, а не второй SDK.
Сложная часть маршрутизации — не сантехника, а сигнал: как решить для каждого запроса, тяжёлая ли задача, до того как вы её запустите? На практике работают три сигнала. Длина входа — самый дешёвый прокси, поскольку запросы сверх некоторого порога по токенам обычно оказываются многофайловыми задачами с большим контекстом, которые вознаграждают Opus 4.8. Тег типа задачи из вашего собственного приложения (классификация против открытой агентной работы) точнее, если он у вас уже есть. И проверка уверенности работает как запасной вариант: сначала прогоняйте Sonnet 5, а эскалируйте на Opus 4.8 только тогда, когда выход дешёвой модели не проходит шаг валидации. Паттерн эскалации держит долю Opus малой — в этом и весь смысл, ведь Opus — дорогой ярус, к которому вы хотите обращаться так редко, как позволяет работа.
flowchart TD
A[Incoming request] --> B{Bounded output?<br/>classification, RAG, chat}
B -->|Yes| C[anthropic/claude-sonnet-5]
B -->|No| D{Frontier coding or<br/>long-horizon reasoning?}
D -->|Yes| E[anthropic/claude-opus-4.8]
D -->|No, measure it| F[A/B both, pick lower per-task cost]
Попробуйте обе через ofox: A/B в 10 строках
Честный способ закрыть вопрос — прогнать обе на вашей собственной нагрузке и прочитать счётчики токенов. ofox отдаёт обе модели на одном OpenAI-совместимом эндпоинте (https://api.ofox.ai/v1), так что единственное, что меняется между прогонами, — строка ID модели. Один нюанс: Sonnet 5 отклоняет недефолтные temperature, top_p и top_k с ошибкой 400, так что оставьте параметры сэмплинга на значениях по умолчанию (примеры ниже так и делают).
Python: A/B обеих моделей в одном цикле
from openai import OpenAI
client = OpenAI(base_url="https://api.ofox.ai/v1", api_key="YOUR_OFOX_KEY")
prompt = "Refactor this function to remove the nested loop: ..."
for model in ["anthropic/claude-sonnet-5", "anthropic/claude-opus-4.8"]:
r = client.chat.completions.create(
model=model,
messages=[{"role": "user", "content": prompt}],
)
u = r.usage
print(model, u.prompt_tokens, u.completion_tokens)
Читайте completion_tokens для каждой. Этот столбец, умноженный на ставку выхода, — то место, где «более дешёвая» модель может тихо перестать быть дешёвой.
Node: та же форма
import OpenAI from "openai";
const client = new OpenAI({ baseURL: "https://api.ofox.ai/v1", apiKey: process.env.OFOX_KEY });
const prompt = "Refactor this function to remove the nested loop: ...";
for (const model of ["anthropic/claude-sonnet-5", "anthropic/claude-opus-4.8"]) {
const r = await client.chat.completions.create({
model,
messages: [{ role: "user", content: prompt }],
});
console.log(model, r.usage.prompt_tokens, r.usage.completion_tokens);
}
Прогоните это на 20–30 репрезентативных задачах, просуммируйте входные и выходные токены по каждой модели и умножьте на ставки из таблицы характеристик. Это число решает вопрос, какую модель куда маршрутизировать, лучше любого бенчмарка. Полную разбивку цен по всей линейке Claude смотрите в нашем руководстве по ценам Claude API.
Подводные камни миграции: что ломается при переходе на Sonnet 5
По форме Sonnet 5 — это drop-in замена Sonnet 4.6, но три изменения в поведении вернут ошибки 400, если ваш старый код рассчитывает на дефолты 4.6. В большинстве случаев это применимо и относительно кода под Opus 4.8.
| Изменение | Старое поведение | На Sonnet 5 |
|---|---|---|
| Параметры сэмплинга | temperature/top_p/top_k принимаются | Недефолтные значения возвращают 400 |
| Ручное расширенное мышление | budget_tokens принимался на части моделей | Возвращает 400; используйте адаптивное мышление + effort |
| Мышление по умолчанию | Выключено, если не запрошено (4.6) | Адаптивное мышление включено по умолчанию; передайте thinking: {type: "disabled"}, чтобы отключить |
Размер max_tokens | Настроен под счёт токенов 4.6 | Может обрезать; новый токенизатор выдаёт больше токенов |
Строка про max_tokens — коварный сбой. Если вы задали бюджеты выхода впритык под Sonnet 4.6, та же генерация на Sonnet 5 выдаёт больше токенов на тот же текст и может упереться в потолок на середине ответа. Поднимите бюджет — иначе будете отгружать обрезанные ответы. Есть и новый предохранитель, о котором стоит знать: Sonnet 5 — первая модель класса Sonnet с отказами по кибербезопасности в реальном времени, которые возвращаются как успешный HTTP 200 с stop_reason: "refusal", а не как ошибка, так что обрабатывайте этот stop reason явно.
Адаптивное мышление — то изменение, что с наибольшей вероятностью сдвинет ваш счёт, и у него есть регулятор. Вместо старой ручки budget_tokens Sonnet 5 выставляет параметр effort (low, medium, high), который меняет глубину рассуждений на расход токенов. Если вы мигрировали нагрузку Opus 4.8, ожидая, что Sonnet 5 будет дешевле, а счёт пришёл ровным, первое, что стоит попробовать, — снизить effort на вызовах, которым не нужны глубокие рассуждения. Высокий effort на вызове классификации — чистая трата, и именно оттуда идёт значительная часть неожиданной стоимости в Сценарии B. Задавайте effort осознанно для каждого маршрута, а не оставляйте каждый вызов на дефолте.
Чистый тест миграции — не оценка в бенчмарке. Это столбец completion_tokens: прогоните обе модели на ваших реальных задачах и позвольте счётчику токенов, а не прайс-листу, решать маршрутизацию.
FAQ
Claude Sonnet 5 лучше, чем Opus 4.8? Не по всем фронтам. Opus 4.8 лидирует в SWE-bench Pro (69,2% против 63,2%) и рассуждениях без инструментов (около 6,6 пункта). Sonnet 5 чуть опережает в интеллектуальной работе (GDPval-AA v2: 1 618 против 1 615) и выигрывает по цене. Sonnet 5 — лучший выбор по умолчанию; Opus 4.8 отрабатывает наценку на самых сложных задачах.
Насколько Claude Sonnet 5 дешевле Opus 4.8? На 60% по вводным ценам ($2/$10 до 31 августа 2026 года), на 40% по стандартной ставке $3/$15 после. Кешированный вход тоже на 60% дешевле ($0.2/M против $0.5/M).
Использует ли Claude Sonnet 5 новый токенизатор? Да, и он выдаёт примерно на 30% больше токенов на тот же текст, чем Sonnet 4.6. Это не изменение API, но пересчитайте промпты и пересмотрите max_tokens, если мигрируете с 4.6.
Почему Claude Sonnet 5 обходится дороже за задачу, чем подсказывает цена? Адаптивное мышление включено по умолчанию, так что на задачу приходится больше выходных токенов. Artificial Analysis оценила примерно $2.29 за задачу — около 15% выше Opus 4.8 в их агентной оценке.
Подходит ли Claude Sonnet 5 для программирования? Да, для большинства задач (63,2% в SWE-bench Pro против 58,1% у Sonnet 4.6). Маршрутизируйте самые сложные агентные задачи на Opus 4.8.
Стоит ли переходить с Opus 4.8 на Sonnet 5? Переведите высокообъёмную часть с ограниченным выходом и сократите этот счёт на 40–60%. Оставьте Opus 4.8 для сложного хвоста. Маршрутизируйте, а не заменяйте.
Каков размер контекстного окна Claude Sonnet 5? 1M токенов, 128K максимум выхода. Из-за нового токенизатора это окно вмещает меньше фактического текста, чем то же окно на Sonnet 4.6.
Можно ли задать temperature на Claude Sonnet 5? Нет. Недефолтные temperature, top_p или top_k возвращают ошибку 400. Удалите их и управляйте через системный промпт.
Проверенные источники
- Anthropic, документация «What’s new in Claude Sonnet 5» (токенизатор, изменения поведения, цены), проверено 1 июля 2026 года: https://platform.claude.com/docs/en/about-claude/models/whats-new-sonnet-5
- Anthropic, пост о запуске «Introducing Claude Sonnet 5», 30 июня 2026 года: https://www.anthropic.com/news/claude-sonnet-5
- Anthropic Transparency Hub (источник по каждому бенчмарку): https://www.anthropic.com/transparency
- Компиляция бенчмарков MarkTechPost (только SWE-bench Pro, GDPval-AA v2), 30 июня 2026 года
- System Card Anthropic через digitalapplied.com и codingfleet.com (разрыв в рассуждениях без инструментов, ~6,6 пункта)
- Оценка стоимости прогона Artificial Analysis ($2.29 за задачу), снимок — конец июня 2026 года
- Страницы моделей ofox для
anthropic/claude-sonnet-5иanthropic/claude-opus-4.8(вводные прайс-цены $2/$10 и $5/$25, контекстное окно), проверено 1 июля 2026 года; разбивка вводной/стандартной ставок и рубеж 31 августа — по документации Anthropic по ценам


