Claude Fable 5 vs Opus 4.8 vs Sonnet 4.6: какую модель брать в 2026 за свои ₽
Релиз Fable 5 9 июня 2026, цены $3/$5/$10 за 1M, SWE-Bench Pro 61–80%, FrontierCode Diamond 7–29%, ProxyAPI/AITUNNEL в РФ — и матрица: когда переплата за Fable окупается, а когда нет.
9 июня 2026 года Anthropic выпустила Claude Fable 5 — первую публичную модель класса Mythos. Цены — $10 за 1M входных и $50 за 1M выходных токенов, в два раза дороже Claude Opus 4.8 ($5/$25) и в три раза дороже Sonnet 4.6 ($3/$15). На обычном агентном кодинге (SWE-Bench Pro) Fable 5 даёт 80.3% против 69.2% у Opus 4.8 — разница 1.16×. На хардовом FrontierCode Diamond — 29.3% против 13.4%, то есть уже 2.2×. Грубое правило: на простых и хорошо описанных задачах (классификация, RAG, разметка, SEO-описания, чат-боты) Sonnet 4.6 даёт 90% качества Fable за 30% цены. Fable окупается там, где задача длинная, контекст широкий и работа компаундится через много шагов — миграции легаси, многодневный автономный кодинг, исследования с агентом. Из России все три модели доступны через ProxyAPI, AITUNNEL и другие OpenAI/Anthropic-совместимые прокси с наценкой ~10–15%.
9 июня 2026 года Anthropic выпустила Claude Fable 5 — модель, которая по бенчмаркам на агентном кодировании отрывается от GPT-5.5 и Gemini 3.1 Pro на 20+ процентных пунктов, а на хардовом FrontierCode Diamond даёт 29.3% против 13.4% у Opus 4.8. Эталонный пример из пресс-релиза — миграция 50 миллионов строк Ruby-кода за один проход модели, на которую у команды людей ушло бы около двух месяцев работы.
Но Fable стоит дорого: $10 за миллион входных токенов и $50 за миллион выходных. Это вдвое больше Opus 4.8 и втрое больше Sonnet 4.6. Вопрос «брать ли Fable» — это не «лучше ли он» (лучше), а «окупится ли разница в 3.3× по цене приростом 1.16× по качеству». В большинстве реальных задач — не окупится. В некоторых — окупается с двукратным запасом.
В статье — разбор семьи Claude в 2026 году на конкретных цифрах: цены, бенчмарки, скрытое поведение safety-классификатора, реальная стоимость одного агент-рана в рублях через российские прокси, и матрица «какую модель брать под какую задачу».
Что появилось 9 июня 2026 — и почему сразу два релиза
Anthropic в один день выкатила две модели одного класса:
- Claude Fable 5 (model ID
claude-fable-5) — публичная версия с встроенным safety-классификатором. Чувствительные запросы (биология, кибербезопасность, химия двойного назначения) автоматически переадресуются в Claude Opus 4.8. - Claude Mythos 5 — та же самая модель без safety-классификатора, доступна только проверенным партнёрам через программу Glasswing.
Это первый раз, когда Anthropic разделила флагман таким способом. Раньше публичная модель и партнёрская были одним и тем же продуктом — просто партнёрам давали ранний доступ. Теперь — публичная версия физически режется на чувствительных запросах, и эти запросы отправляются в более слабую (но «более понятную для аудита») Opus 4.8.
Mythos 5 — внутреннее кодовое имя, которое Anthropic в начале 2026 года использовала для описания своего нового флагмана в публикациях по безопасности. После релиза 9 июня публичный API получил имя Fable 5, а Mythos 5 — это та же модель «как она есть», без safety-роутера, для исследователей и крупных enterprise-партнёров с подписанным соглашением.
В Pro/Max/Team-подписках Claude.ai Fable 5 включён без доплаты до 22 июня 2026. После этой даты — переход на consumption-based-биллинг через API или на отдельные enterprise-планы.
Три действующие модели в семье — и одна «за стеной»
Картина на конец июня 2026:
| Модель | Цена $/1M (вход / выход) | Контекстное окно | Когда брать |
|---|---|---|---|
| Sonnet 4.6 | $3 / $15 | 200K | Базовая модель: RAG, классификация, чат-боты, SEO-описания, разметка |
| Opus 4.8 | $5 / $25 | 200K | Продвинутая аналитика, сложные документы, программирование с проверкой |
| Fable 5 | $10 / $50 | 200K (с persistent memory — больше) | Многодневные автономные сессии, миграции легаси, deep research с агентом |
| Mythos 5 | по соглашению | 200K+ | Закрытая (Glasswing-партнёры). Сравнения с публикой нет |
Заметна геометрическая прогрессия по цене: ×1.7 от Sonnet до Opus, ×2.0 от Opus до Fable. Контекстное окно одинаковое — 200 тысяч токенов (это около 150 000 русских слов или 500–700 страниц обычного текста). Sonnet 4.6 и Opus 4.8 — это эволюционные апдейты предыдущих семейств 4.6 и 4.7, Fable 5 — формально новое поколение, открывающее линейку 5.
Бенчмарки: где разрыв вырастает, а где исчезает
Anthropic в день релиза опубликовала набор бенчмарков. Самые показательные — те, где Fable 5 сравнивается с Opus 4.8 (предыдущим флагманом Anthropic), GPT-5.5 (флагман OpenAI на момент релиза) и Gemini 3.1 Pro (флагман Google).
Агентное кодирование — SWE-Bench Pro
Тест проверяет, может ли модель автономно разобраться в pull-request к реальному open-source-проекту, локализовать баг или фичу и предложить рабочий патч.
- Claude Fable 5 — 80.3%
- Claude Opus 4.8 — 69.2%
- GPT-5.5 — 58.6%
- Gemini 3.1 Pro — 54.2%
Здесь Fable 5 отрывается от ближайшего конкурента (своего же Opus 4.8) на 11 процентных пунктов. От GPT-5.5 — на 21.7 п.п., от Gemini — на 26.1 п.п. Это самый широкий разрыв, который Anthropic показала среди опубликованных бенчмарков.
Хардовый кодинг — FrontierCode Diamond
Подмножество SWE-Bench с самыми сложными задачами, на которых даже опытные инженеры тратят сутки и больше. Здесь разрыв вырастает кратно:
- Claude Fable 5 — 29.3%
- Claude Opus 4.8 — 13.4%
Разница уже в 2.2 раза. Логика простая: на простых задачах потолок «и так понятно», а на сложных — каждая дополнительная единица интеллекта даёт диспропорциональный прирост успеха.
Знаниевая работа — GDPval-AA
GDPval-AA — бенчмарк, симулирующий рабочие задания, эквивалентные средней «знаниевой» работе американского экономиста. Fable 5 набирает 1932 балла и занимает первую строчку рейтинга на момент релиза.
Пространственное мышление и инструменты
- Spatial reasoning: 38.6% (Fable 5)
- Tool use: 17.4%
- Legal: 13.3%
- Health: 66.0%
Цифры по медицине и юриспруденции выглядят умеренными, но Anthropic в публикациях отмечает, что эти бенчмарки специально занижены через safety-классификатор — большая часть «правильных» ответов в этих доменах попадает в категорию «требует профессиональной верификации», и модель отказывается давать прямой ответ. Это особенность публичной Fable, не Mythos.
Длинный контекст и persistent memory
Один из самых наглядных тестов — Anthropic дала Fable 5 играть в карточный roguelike Slay the Spire с persistent file-based memory (модель сохраняла наблюдения между ходами в файл). Результат: Fable 5 в 3 раза чаще доходила до финального акта по сравнению с Opus 4.8 при тех же условиях.
Это критичный сигнал для агентных применений: когда задача требует не одного запроса, а серии связанных шагов с переносом контекста — Fable масштабируется лучше предшественников непропорционально цене.
Реальный кейс релиза: 50 миллионов строк Ruby за день
В пресс-релизе Anthropic привела кейс одного из своих enterprise-партнёров: миграция Ruby-кодовой базы объёмом 50 миллионов строк (включая зависимости, тесты и DSL-скрипты) на новую версию runtime + рефакторинг под новую структуру модулей. Команде разработчиков потребовалось бы около двух месяцев человеко-часов на эту работу.
Fable 5 в режиме автономного агентского кодирования через Claude Code прошёл миграцию за один день, с автоматической прогонкой тестов и фиксацией нарушений. Финальный аудит сделала команда людей за день — итого два дня вместо двух месяцев.
Кейс показателен, но не репрезентативен. 50 миллионов строк Ruby — это огромная, хорошо протестированная и хорошо документированная база. Модель не «придумала миграцию из воздуха», а провела её по понятным шагам, опираясь на тесты как фидбек. В типовом продуктовом коде с плохой документацией и без покрытия тестами Fable будет работать хуже — но всё равно лучше, чем Opus 4.8, и кратно лучше, чем Sonnet 4.6.
Когда какую модель брать: 7 сценариев из практики
Анализ по типам задач — где модель окупается, а где переплачивается.
1. Чат-бот с FAQ / поддержка клиентов → Sonnet 4.6
Задача узкая: распознать вопрос, найти ответ в базе знаний, переформулировать. Качество всех трёх моделей на такой задаче — выше 95%. Платить за Fable 5 нет смысла. Sonnet 4.6 покрывает с запасом, и при объёме в десятки тысяч запросов в день экономия в 3.3× превращается в десятки тысяч рублей в месяц.
2. RAG-поиск по корпоративной базе → Sonnet 4.6 (иногда Opus 4.8)
Большая часть задачи — это retrieval (поиск). Генерация ответа — короткий шаг, где разница между моделями минимальна. Sonnet 4.6 хватит. Перейти на Opus 4.8 стоит, если ответы должны включать сложные выводы или сопоставление противоречивых документов.
3. SEO-описание карточки товара / контент для маркетплейсов → Sonnet 4.6
Творческая задача, но с жёсткими шаблонами и ограничениями (заголовок 60 символов, описание 1000, ключи в конкретных позициях). Sonnet 4.6 закрывает 100%. На массовом потоке — 1000+ карточек в день — переплата за Fable окажется хуже, чем «один из 100 описаний не оптимален».
4. Анализ юридических документов / контрактов → Opus 4.8
Точность и аккуратность важнее цены. Opus 4.8 на длинных контрактах с перекрёстными ссылками работает значительно надёжнее Sonnet 4.6 (особенно когда документ требует «связать пункт 14.5 с приложением 3.7»). Fable 5 даст ещё прирост, но в юр.доменах safety-классификатор часто срабатывает и роутит запрос обратно в Opus — фактически платите за Fable, получаете Opus.
5. Сложный кодинг / автономный агент / Claude Code → Fable 5
Это главный сценарий Fable. Многошаговая работа в реальном репозитории, рефакторинг, миграции, фикс багов с пониманием контекста на десятки файлов сразу. Здесь разрыв 80.3% vs 69.2% на SWE-Bench Pro и 2.2× на FrontierCode Diamond превращается в «модель решила задачу с первого раза» vs «пришлось делать ещё 3 итерации». На 5–10 итерациях экономия времени разработчика перекрывает разницу в цене.
6. Deep research / многошаговое исследование → Fable 5
Задачи вида «изучить рынок, проанализировать 50 источников, составить отчёт». С persistent memory Fable 5 в 3 раза реже теряет нить. Для агентских пайплайнов, которые работают часами без участия человека — оплачивать прирост качества проще, чем пересматривать ошибочный отчёт.
7. Разбор смет, нормативки, проектной документации → Opus 4.8 (иногда Fable 5)
Задача стройки: разобрать локальную смету по ФСНБ-2022, сопоставить с нормами ГЭСН, отметить расхождения. Opus 4.8 здесь оптимален: точность сопоставления высокая, цена приемлемая. Fable 5 даёт прирост на «нестандартных» сметах (где много исключений и нестандартных коэффициентов), но в массовом потоке Opus достаточно.
Anthropic API без VPN — все три модели в одном эндпоинте
OpenAI/Anthropic-совместимый эндпоинт на российских GPU. Sonnet 4.6, Opus 4.8 и Fable 5 — в одном API. Меняется только параметр model в запросе. Оплата рублями, договор с юрлицом.
Сколько это в рублях через российские прокси
Прямой доступ к Anthropic API из России невозможен без VPN и зарубежной карты (подробнее — в нашей статье про Claude в РФ). Рабочий вариант — российские прокси-агрегаторы:
| Прокси | Sonnet 4.6 (₽/1M вход / выход) | Opus 4.8 (₽/1M) | Fable 5 (₽/1M) | Наценка |
|---|---|---|---|---|
| ProxyAPI | ~290 / 1450 | ~480 / 2400 | ~880 / 4400 | ~10% |
| AITUNNEL | ~576 / 2880 | ~960 / 4800 | ~1760 / 8800 | ~15% |
| Базовая Anthropic | $3 / $15 | $5 / $25 | $10 / $50 | — |
Цены в таблице — ориентировочные на 20 июня 2026 и могут отличаться от текущих, проверяйте на сайте прокси. Курс пересчёта USD→₽ — около 80 ₽/$.
Реальная стоимость одного «агент-рана»
Типовой агент-ран в Claude Code или вашем продакшене — это 200 000 входных токенов (контекст, история, файлы) и 30 000 выходных (ответ модели). При курсе 80 ₽/$ и наценке ProxyAPI ~10%:
| Модель | Стоимость одного агент-рана |
|---|---|
| Sonnet 4.6 | $1.05 → ~92 ₽ |
| Opus 4.8 | $1.75 → ~154 ₽ |
| Fable 5 | $3.50 → ~308 ₽ |
При 1000 агент-ранов в день разница накапливается:
- Sonnet 4.6 — около 2.7 млн ₽/месяц
- Opus 4.8 — около 4.6 млн ₽/месяц
- Fable 5 — около 9.2 млн ₽/месяц
Эти цифры — для серверного агента, который работает без перерывов. Для интерактивного использования (один разработчик с Claude Code) счёт обычно в 10–50 раз меньше: 30–100 ранов в день, что превращается в 100–300 тыс ₽/мес. Допустимо для команды, но за этим всё равно стоит смотреть.
В Anthropic API работает prompt caching — повторяющиеся части промпта (системный prompt, фиксированный контекст) кэшируются и пересчитываются по сниженной ставке. На многошаговых задачах это даёт 30–60% экономии. ProxyAPI и AITUNNEL пробрасывают cache_control к Anthropic, остальные российские прокси (VseGPT, GPTunnel, BotHub) — частично или вообще не пробрасывают. Если планируете использовать caching — выбирайте провайдера с поддержкой.
Safety classifier Fable 5: что роутится в Opus и почему
Главная скрытая особенность Fable 5 — встроенный safety-классификатор, который при обнаружении «потенциально опасной темы» автоматически отправляет запрос в Claude Opus 4.8 (вместо самой Fable). Цена остаётся как у Fable 5 — то есть формально вы заплатили за Fable, по факту работала Opus.
Anthropic не публикует полный список триггеров, но из практики и анонимных отчётов сообщества вырисовываются такие категории:
- Кибербезопасность — запросы про эксплойты, обход MFA, разработку вредоносного ПО, реверс-инжиниринг закрытых протоколов
- Биология двойного назначения — работа с патогенами, синтез токсинов, обход биологических защитных систем
- Химия двойного назначения — синтез контролируемых веществ, прекурсоров
- Самопроизводящиеся системы — самораспространяющийся код, автономные ботнеты
- Атаки на критическую инфраструктуру — энергосети, водоснабжение, банковские системы
Для легитимных применений эти триггеры срабатывают редко. Типичные сценарии «случайных» срабатываний:
- Анализ медицинских данных пациентов (попадает под «здоровье»)
- Юридическая работа с делами по экстремизму или терроризму
- Pentest-репорты в компании по информационной безопасности (попадает под «кибербез»)
- Исследовательский анализ публикаций по вирусологии
Если ваша задача — что-то из этого, и Fable 5 регулярно «откатывается» в Opus — экономически разумнее работать сразу с Opus 4.8 (он дешевле). Чтобы это понять, нужно смотреть на ответы Anthropic API — там есть метаданные, показывающие, какая модель реально обработала запрос.
8 типовых ошибок при выборе модели Claude
1. Брать Fable 5 «потому что флагман» на простые задачи
Самая массовая ошибка. RAG-поиск по корпоративной базе, классификация тикетов, генерация SEO-карточек — Sonnet 4.6 делает их с тем же качеством, что и Fable 5, но в 3.3× дешевле. Деньги, потраченные на «не пожалели — взяли лучшую», уходят впустую.
2. Брать Sonnet 4.6 на сложный кодинг
Обратная ошибка. Команда экономит на API, разработчики тратят в 5 раз больше времени на доводку ответов Sonnet. Час разработчика стоит дороже, чем разница в стоимости моделей за день работы.
3. Не учитывать prompt caching
Многошаговые задачи с большим фиксированным контекстом без кэширования стоят в 2–3 раза дороже, чем должны. У ProxyAPI и AITUNNEL cache_control работает, у прочих российских прокси — нет. Проверяйте перед интеграцией.
4. Считать только входные токены
«Fable дороже на $7/1M токенов» — это про выход. Выходные токены модели дают $50/1M vs $25/1M у Opus и $15/1M у Sonnet. На задачах с длинными ответами (генерация отчётов, кода, документации) большую часть счёта формируют именно они.
5. Игнорировать safety-роутинг
Если ваша задача — анализ медицинских записей или pentest-отчётов, и Fable 5 регулярно роутится в Opus 4.8 — вы платите за Fable, получаете Opus. Экономически разумно сразу переключиться на Opus 4.8 и не платить наценку «флагмана».
6. Не тестировать на собственных задачах
Бенчмарки Anthropic — про средневзвешенные сценарии. Ваш конкретный случай может оказаться где-то на краю распределения. Перед выкаткой в прод — гонять А/B на 100–200 реальных запросах и смотреть на качество, не на бенчмарк.
7. Запускать Fable 5 без лимита на toolcalls
Агентный режим Fable 5 — модель может зацикливаться и тратить сотни тысяч токенов на одной задаче, если плохо сформулировать stopping criteria. Один забывчивый запуск без max_tokens или ограничения числа iterations — счёт в десятки тысяч рублей за пять минут. Всегда настраивайте лимиты.
8. Использовать Mythos 5 «как раньше использовали Sonnet»
Mythos 5 — это partner-only модель без safety. Если у вас есть к ней доступ, помните: это исследовательский инструмент, не replacement Sonnet. В продакшене (особенно при обработке клиентских данных или взаимодействии с пользователями) всё равно нужна Fable с защитой — иначе риски репутационные и юридические могут перекрыть весь экономический выигрыш.
Чек-лист выбора модели Claude в 2026
Для каждой новой задачи — пройдитесь по списку:
- Тип задачи определён: RAG / классификация / чат / кодинг / агент / deep research
- Объём контекста оценен: до 50K — Sonnet хватит, 50–150K — Opus, выше — Fable
- Длина выхода оценена: ответы короткие → выходные токены не критичны → можно брать дороже; ответы длинные → переплата за Fable удваивается
- Многошаговость проверена: 1–3 шага → Sonnet/Opus, 5+ с persistent context → Fable
- Safety-домены проверены: если задача попадает в чувствительную категорию → сразу Opus 4.8
- Prompt caching включён в архитектуре (если есть фиксированный контекст)
- Лимиты на токены и iterations настроены (особенно для Fable в агентном режиме)
- Прокси для РФ выбран с поддержкой
cache_control(ProxyAPI / AITUNNEL) - A/B-тест на 100–200 реальных запросах проведён до прод-выкатки
- Биллинг-алерты установлены: уведомление при превышении X ₽/день
Итого
Геометрическая прогрессия по цене (×1.7, ×2.0) не сопровождается такой же прогрессией по качеству. На простых задачах все три модели работают одинаково хорошо — Sonnet 4.6 экономит вам деньги без потери качества. На средних — Opus 4.8 даёт оптимальный баланс. Fable 5 окупается только там, где задача длинная, многошаговая и компаундится — миграции, автономный кодинг, deep research с persistent memory. На любых других сценариях вы платите за бренд флагмана, а не за прирост качества.
Дополнительная сложность для российских пользователей — выбор прокси. ProxyAPI с наценкой ~10% и проброшенным cache_control остаётся оптимальным вариантом для большинства задач. AITUNNEL — для тех, кому важен корпоративный договор и закрывающие документы для бухгалтерии.
И последнее: Anthropic очевидно использует Fable 5 как «дойную корову» — модель, на которой за полгода до релиза Sonnet 5 (вероятно, в конце 2026) Anthropic зарабатывает по премиальной цене. Для большинства команд правильная стратегия — подождать, остаться на Opus 4.8 или Sonnet 4.6, и пересмотреть выбор, когда выйдет новый Sonnet с частью качества Fable за треть цены.
Все три модели Claude — в одном API без VPN
Меняете model в запросе — выбираете Sonnet 4.6, Opus 4.8 или Fable 5. Prompt caching проброшен, оплата рублями, договор для юрлица, закрывающие документы. Тот же SDK, никакой миграции кода.