AI-мощности·14 мин·20 июня 2026

Claude Fable 5 vs Opus 4.8 vs Sonnet 4.6: какую модель брать в 2026 за свои ₽

Релиз Fable 5 9 июня 2026, цены $3/$5/$10 за 1M, SWE-Bench Pro 61–80%, FrontierCode Diamond 7–29%, ProxyAPI/AITUNNEL в РФ — и матрица: когда переплата за Fable окупается, а когда нет.

Команда autollab
Claude Fable 5 vs Opus 4.8 vs Sonnet 4.6: какую модель брать в 2026 за свои ₽
Коротко

9 июня 2026 года Anthropic выпустила Claude Fable 5 — первую публичную модель класса Mythos. Цены — $10 за 1M входных и $50 за 1M выходных токенов, в два раза дороже Claude Opus 4.8 ($5/$25) и в три раза дороже Sonnet 4.6 ($3/$15). На обычном агентном кодинге (SWE-Bench Pro) Fable 5 даёт 80.3% против 69.2% у Opus 4.8 — разница 1.16×. На хардовом FrontierCode Diamond — 29.3% против 13.4%, то есть уже 2.2×. Грубое правило: на простых и хорошо описанных задачах (классификация, RAG, разметка, SEO-описания, чат-боты) Sonnet 4.6 даёт 90% качества Fable за 30% цены. Fable окупается там, где задача длинная, контекст широкий и работа компаундится через много шагов — миграции легаси, многодневный автономный кодинг, исследования с агентом. Из России все три модели доступны через ProxyAPI, AITUNNEL и другие OpenAI/Anthropic-совместимые прокси с наценкой ~10–15%.

9 июня 2026 года Anthropic выпустила Claude Fable 5 — модель, которая по бенчмаркам на агентном кодировании отрывается от GPT-5.5 и Gemini 3.1 Pro на 20+ процентных пунктов, а на хардовом FrontierCode Diamond даёт 29.3% против 13.4% у Opus 4.8. Эталонный пример из пресс-релиза — миграция 50 миллионов строк Ruby-кода за один проход модели, на которую у команды людей ушло бы около двух месяцев работы.

Но Fable стоит дорого: $10 за миллион входных токенов и $50 за миллион выходных. Это вдвое больше Opus 4.8 и втрое больше Sonnet 4.6. Вопрос «брать ли Fable» — это не «лучше ли он» (лучше), а «окупится ли разница в 3.3× по цене приростом 1.16× по качеству». В большинстве реальных задач — не окупится. В некоторых — окупается с двукратным запасом.

В статье — разбор семьи Claude в 2026 году на конкретных цифрах: цены, бенчмарки, скрытое поведение safety-классификатора, реальная стоимость одного агент-рана в рублях через российские прокси, и матрица «какую модель брать под какую задачу».

Что появилось 9 июня 2026 — и почему сразу два релиза

Anthropic в один день выкатила две модели одного класса:

  • Claude Fable 5 (model ID claude-fable-5) — публичная версия с встроенным safety-классификатором. Чувствительные запросы (биология, кибербезопасность, химия двойного назначения) автоматически переадресуются в Claude Opus 4.8.
  • Claude Mythos 5 — та же самая модель без safety-классификатора, доступна только проверенным партнёрам через программу Glasswing.

Это первый раз, когда Anthropic разделила флагман таким способом. Раньше публичная модель и партнёрская были одним и тем же продуктом — просто партнёрам давали ранний доступ. Теперь — публичная версия физически режется на чувствительных запросах, и эти запросы отправляются в более слабую (но «более понятную для аудита») Opus 4.8.

Mythos 5 — внутреннее кодовое имя, которое Anthropic в начале 2026 года использовала для описания своего нового флагмана в публикациях по безопасности. После релиза 9 июня публичный API получил имя Fable 5, а Mythos 5 — это та же модель «как она есть», без safety-роутера, для исследователей и крупных enterprise-партнёров с подписанным соглашением.

В Pro/Max/Team-подписках Claude.ai Fable 5 включён без доплаты до 22 июня 2026. После этой даты — переход на consumption-based-биллинг через API или на отдельные enterprise-планы.

Три действующие модели в семье — и одна «за стеной»

Картина на конец июня 2026:

МодельЦена $/1M (вход / выход)Контекстное окноКогда брать
Sonnet 4.6$3 / $15200KБазовая модель: RAG, классификация, чат-боты, SEO-описания, разметка
Opus 4.8$5 / $25200KПродвинутая аналитика, сложные документы, программирование с проверкой
Fable 5$10 / $50200K (с persistent memory — больше)Многодневные автономные сессии, миграции легаси, deep research с агентом
Mythos 5по соглашению200K+Закрытая (Glasswing-партнёры). Сравнения с публикой нет

Заметна геометрическая прогрессия по цене: ×1.7 от Sonnet до Opus, ×2.0 от Opus до Fable. Контекстное окно одинаковое — 200 тысяч токенов (это около 150 000 русских слов или 500–700 страниц обычного текста). Sonnet 4.6 и Opus 4.8 — это эволюционные апдейты предыдущих семейств 4.6 и 4.7, Fable 5 — формально новое поколение, открывающее линейку 5.

Бенчмарки: где разрыв вырастает, а где исчезает

Anthropic в день релиза опубликовала набор бенчмарков. Самые показательные — те, где Fable 5 сравнивается с Opus 4.8 (предыдущим флагманом Anthropic), GPT-5.5 (флагман OpenAI на момент релиза) и Gemini 3.1 Pro (флагман Google).

Агентное кодирование — SWE-Bench Pro

Тест проверяет, может ли модель автономно разобраться в pull-request к реальному open-source-проекту, локализовать баг или фичу и предложить рабочий патч.

  • Claude Fable 5 — 80.3%
  • Claude Opus 4.8 — 69.2%
  • GPT-5.5 — 58.6%
  • Gemini 3.1 Pro — 54.2%

Здесь Fable 5 отрывается от ближайшего конкурента (своего же Opus 4.8) на 11 процентных пунктов. От GPT-5.5 — на 21.7 п.п., от Gemini — на 26.1 п.п. Это самый широкий разрыв, который Anthropic показала среди опубликованных бенчмарков.

Хардовый кодинг — FrontierCode Diamond

Подмножество SWE-Bench с самыми сложными задачами, на которых даже опытные инженеры тратят сутки и больше. Здесь разрыв вырастает кратно:

  • Claude Fable 5 — 29.3%
  • Claude Opus 4.8 — 13.4%

Разница уже в 2.2 раза. Логика простая: на простых задачах потолок «и так понятно», а на сложных — каждая дополнительная единица интеллекта даёт диспропорциональный прирост успеха.

Знаниевая работа — GDPval-AA

GDPval-AA — бенчмарк, симулирующий рабочие задания, эквивалентные средней «знаниевой» работе американского экономиста. Fable 5 набирает 1932 балла и занимает первую строчку рейтинга на момент релиза.

Пространственное мышление и инструменты

  • Spatial reasoning: 38.6% (Fable 5)
  • Tool use: 17.4%
  • Legal: 13.3%
  • Health: 66.0%

Цифры по медицине и юриспруденции выглядят умеренными, но Anthropic в публикациях отмечает, что эти бенчмарки специально занижены через safety-классификатор — большая часть «правильных» ответов в этих доменах попадает в категорию «требует профессиональной верификации», и модель отказывается давать прямой ответ. Это особенность публичной Fable, не Mythos.

Длинный контекст и persistent memory

Один из самых наглядных тестов — Anthropic дала Fable 5 играть в карточный roguelike Slay the Spire с persistent file-based memory (модель сохраняла наблюдения между ходами в файл). Результат: Fable 5 в 3 раза чаще доходила до финального акта по сравнению с Opus 4.8 при тех же условиях.

Это критичный сигнал для агентных применений: когда задача требует не одного запроса, а серии связанных шагов с переносом контекста — Fable масштабируется лучше предшественников непропорционально цене.

Реальный кейс релиза: 50 миллионов строк Ruby за день

В пресс-релизе Anthropic привела кейс одного из своих enterprise-партнёров: миграция Ruby-кодовой базы объёмом 50 миллионов строк (включая зависимости, тесты и DSL-скрипты) на новую версию runtime + рефакторинг под новую структуру модулей. Команде разработчиков потребовалось бы около двух месяцев человеко-часов на эту работу.

Fable 5 в режиме автономного агентского кодирования через Claude Code прошёл миграцию за один день, с автоматической прогонкой тестов и фиксацией нарушений. Финальный аудит сделала команда людей за день — итого два дня вместо двух месяцев.

Кейс показателен, но не репрезентативен. 50 миллионов строк Ruby — это огромная, хорошо протестированная и хорошо документированная база. Модель не «придумала миграцию из воздуха», а провела её по понятным шагам, опираясь на тесты как фидбек. В типовом продуктовом коде с плохой документацией и без покрытия тестами Fable будет работать хуже — но всё равно лучше, чем Opus 4.8, и кратно лучше, чем Sonnet 4.6.

Когда какую модель брать: 7 сценариев из практики

Анализ по типам задач — где модель окупается, а где переплачивается.

1. Чат-бот с FAQ / поддержка клиентов → Sonnet 4.6

Задача узкая: распознать вопрос, найти ответ в базе знаний, переформулировать. Качество всех трёх моделей на такой задаче — выше 95%. Платить за Fable 5 нет смысла. Sonnet 4.6 покрывает с запасом, и при объёме в десятки тысяч запросов в день экономия в 3.3× превращается в десятки тысяч рублей в месяц.

2. RAG-поиск по корпоративной базе → Sonnet 4.6 (иногда Opus 4.8)

Большая часть задачи — это retrieval (поиск). Генерация ответа — короткий шаг, где разница между моделями минимальна. Sonnet 4.6 хватит. Перейти на Opus 4.8 стоит, если ответы должны включать сложные выводы или сопоставление противоречивых документов.

3. SEO-описание карточки товара / контент для маркетплейсов → Sonnet 4.6

Творческая задача, но с жёсткими шаблонами и ограничениями (заголовок 60 символов, описание 1000, ключи в конкретных позициях). Sonnet 4.6 закрывает 100%. На массовом потоке — 1000+ карточек в день — переплата за Fable окажется хуже, чем «один из 100 описаний не оптимален».

4. Анализ юридических документов / контрактов → Opus 4.8

Точность и аккуратность важнее цены. Opus 4.8 на длинных контрактах с перекрёстными ссылками работает значительно надёжнее Sonnet 4.6 (особенно когда документ требует «связать пункт 14.5 с приложением 3.7»). Fable 5 даст ещё прирост, но в юр.доменах safety-классификатор часто срабатывает и роутит запрос обратно в Opus — фактически платите за Fable, получаете Opus.

5. Сложный кодинг / автономный агент / Claude Code → Fable 5

Это главный сценарий Fable. Многошаговая работа в реальном репозитории, рефакторинг, миграции, фикс багов с пониманием контекста на десятки файлов сразу. Здесь разрыв 80.3% vs 69.2% на SWE-Bench Pro и 2.2× на FrontierCode Diamond превращается в «модель решила задачу с первого раза» vs «пришлось делать ещё 3 итерации». На 5–10 итерациях экономия времени разработчика перекрывает разницу в цене.

6. Deep research / многошаговое исследование → Fable 5

Задачи вида «изучить рынок, проанализировать 50 источников, составить отчёт». С persistent memory Fable 5 в 3 раза реже теряет нить. Для агентских пайплайнов, которые работают часами без участия человека — оплачивать прирост качества проще, чем пересматривать ошибочный отчёт.

7. Разбор смет, нормативки, проектной документации → Opus 4.8 (иногда Fable 5)

Задача стройки: разобрать локальную смету по ФСНБ-2022, сопоставить с нормами ГЭСН, отметить расхождения. Opus 4.8 здесь оптимален: точность сопоставления высокая, цена приемлемая. Fable 5 даёт прирост на «нестандартных» сметах (где много исключений и нестандартных коэффициентов), но в массовом потоке Opus достаточно.

$3 / $5 / $10
Sonnet / Opus / Fable, вход 1M
80.3% vs 69.2%
SWE-Bench Pro: Fable vs Opus
2.2×
разрыв на FrontierCode Diamond
чаще до финала в Slay the Spire

Anthropic API без VPN — все три модели в одном эндпоинте

OpenAI/Anthropic-совместимый эндпоинт на российских GPU. Sonnet 4.6, Opus 4.8 и Fable 5 — в одном API. Меняется только параметр model в запросе. Оплата рублями, договор с юрлицом.

Попробовать

Сколько это в рублях через российские прокси

Прямой доступ к Anthropic API из России невозможен без VPN и зарубежной карты (подробнее — в нашей статье про Claude в РФ). Рабочий вариант — российские прокси-агрегаторы:

ПроксиSonnet 4.6 (₽/1M вход / выход)Opus 4.8 (₽/1M)Fable 5 (₽/1M)Наценка
ProxyAPI~290 / 1450~480 / 2400~880 / 4400~10%
AITUNNEL~576 / 2880~960 / 4800~1760 / 8800~15%
Базовая Anthropic$3 / $15$5 / $25$10 / $50

Цены в таблице — ориентировочные на 20 июня 2026 и могут отличаться от текущих, проверяйте на сайте прокси. Курс пересчёта USD→₽ — около 80 ₽/$.

Реальная стоимость одного «агент-рана»

Типовой агент-ран в Claude Code или вашем продакшене — это 200 000 входных токенов (контекст, история, файлы) и 30 000 выходных (ответ модели). При курсе 80 ₽/$ и наценке ProxyAPI ~10%:

МодельСтоимость одного агент-рана
Sonnet 4.6$1.05 → ~92 ₽
Opus 4.8$1.75 → ~154 ₽
Fable 5$3.50 → ~308 ₽

При 1000 агент-ранов в день разница накапливается:

  • Sonnet 4.6 — около 2.7 млн ₽/месяц
  • Opus 4.8 — около 4.6 млн ₽/месяц
  • Fable 5 — около 9.2 млн ₽/месяц

Эти цифры — для серверного агента, который работает без перерывов. Для интерактивного использования (один разработчик с Claude Code) счёт обычно в 10–50 раз меньше: 30–100 ранов в день, что превращается в 100–300 тыс ₽/мес. Допустимо для команды, но за этим всё равно стоит смотреть.

В Anthropic API работает prompt caching — повторяющиеся части промпта (системный prompt, фиксированный контекст) кэшируются и пересчитываются по сниженной ставке. На многошаговых задачах это даёт 30–60% экономии. ProxyAPI и AITUNNEL пробрасывают cache_control к Anthropic, остальные российские прокси (VseGPT, GPTunnel, BotHub) — частично или вообще не пробрасывают. Если планируете использовать caching — выбирайте провайдера с поддержкой.

Safety classifier Fable 5: что роутится в Opus и почему

Главная скрытая особенность Fable 5 — встроенный safety-классификатор, который при обнаружении «потенциально опасной темы» автоматически отправляет запрос в Claude Opus 4.8 (вместо самой Fable). Цена остаётся как у Fable 5 — то есть формально вы заплатили за Fable, по факту работала Opus.

Anthropic не публикует полный список триггеров, но из практики и анонимных отчётов сообщества вырисовываются такие категории:

  • Кибербезопасность — запросы про эксплойты, обход MFA, разработку вредоносного ПО, реверс-инжиниринг закрытых протоколов
  • Биология двойного назначения — работа с патогенами, синтез токсинов, обход биологических защитных систем
  • Химия двойного назначения — синтез контролируемых веществ, прекурсоров
  • Самопроизводящиеся системы — самораспространяющийся код, автономные ботнеты
  • Атаки на критическую инфраструктуру — энергосети, водоснабжение, банковские системы

Для легитимных применений эти триггеры срабатывают редко. Типичные сценарии «случайных» срабатываний:

  • Анализ медицинских данных пациентов (попадает под «здоровье»)
  • Юридическая работа с делами по экстремизму или терроризму
  • Pentest-репорты в компании по информационной безопасности (попадает под «кибербез»)
  • Исследовательский анализ публикаций по вирусологии

Если ваша задача — что-то из этого, и Fable 5 регулярно «откатывается» в Opus — экономически разумнее работать сразу с Opus 4.8 (он дешевле). Чтобы это понять, нужно смотреть на ответы Anthropic API — там есть метаданные, показывающие, какая модель реально обработала запрос.

8 типовых ошибок при выборе модели Claude

1. Брать Fable 5 «потому что флагман» на простые задачи

Самая массовая ошибка. RAG-поиск по корпоративной базе, классификация тикетов, генерация SEO-карточек — Sonnet 4.6 делает их с тем же качеством, что и Fable 5, но в 3.3× дешевле. Деньги, потраченные на «не пожалели — взяли лучшую», уходят впустую.

2. Брать Sonnet 4.6 на сложный кодинг

Обратная ошибка. Команда экономит на API, разработчики тратят в 5 раз больше времени на доводку ответов Sonnet. Час разработчика стоит дороже, чем разница в стоимости моделей за день работы.

3. Не учитывать prompt caching

Многошаговые задачи с большим фиксированным контекстом без кэширования стоят в 2–3 раза дороже, чем должны. У ProxyAPI и AITUNNEL cache_control работает, у прочих российских прокси — нет. Проверяйте перед интеграцией.

4. Считать только входные токены

«Fable дороже на $7/1M токенов» — это про выход. Выходные токены модели дают $50/1M vs $25/1M у Opus и $15/1M у Sonnet. На задачах с длинными ответами (генерация отчётов, кода, документации) большую часть счёта формируют именно они.

5. Игнорировать safety-роутинг

Если ваша задача — анализ медицинских записей или pentest-отчётов, и Fable 5 регулярно роутится в Opus 4.8 — вы платите за Fable, получаете Opus. Экономически разумно сразу переключиться на Opus 4.8 и не платить наценку «флагмана».

6. Не тестировать на собственных задачах

Бенчмарки Anthropic — про средневзвешенные сценарии. Ваш конкретный случай может оказаться где-то на краю распределения. Перед выкаткой в прод — гонять А/B на 100–200 реальных запросах и смотреть на качество, не на бенчмарк.

7. Запускать Fable 5 без лимита на toolcalls

Агентный режим Fable 5 — модель может зацикливаться и тратить сотни тысяч токенов на одной задаче, если плохо сформулировать stopping criteria. Один забывчивый запуск без max_tokens или ограничения числа iterations — счёт в десятки тысяч рублей за пять минут. Всегда настраивайте лимиты.

8. Использовать Mythos 5 «как раньше использовали Sonnet»

Mythos 5 — это partner-only модель без safety. Если у вас есть к ней доступ, помните: это исследовательский инструмент, не replacement Sonnet. В продакшене (особенно при обработке клиентских данных или взаимодействии с пользователями) всё равно нужна Fable с защитой — иначе риски репутационные и юридические могут перекрыть весь экономический выигрыш.

Чек-лист выбора модели Claude в 2026

Для каждой новой задачи — пройдитесь по списку:

  • Тип задачи определён: RAG / классификация / чат / кодинг / агент / deep research
  • Объём контекста оценен: до 50K — Sonnet хватит, 50–150K — Opus, выше — Fable
  • Длина выхода оценена: ответы короткие → выходные токены не критичны → можно брать дороже; ответы длинные → переплата за Fable удваивается
  • Многошаговость проверена: 1–3 шага → Sonnet/Opus, 5+ с persistent context → Fable
  • Safety-домены проверены: если задача попадает в чувствительную категорию → сразу Opus 4.8
  • Prompt caching включён в архитектуре (если есть фиксированный контекст)
  • Лимиты на токены и iterations настроены (особенно для Fable в агентном режиме)
  • Прокси для РФ выбран с поддержкой cache_control (ProxyAPI / AITUNNEL)
  • A/B-тест на 100–200 реальных запросах проведён до прод-выкатки
  • Биллинг-алерты установлены: уведомление при превышении X ₽/день

Итого

Геометрическая прогрессия по цене (×1.7, ×2.0) не сопровождается такой же прогрессией по качеству. На простых задачах все три модели работают одинаково хорошо — Sonnet 4.6 экономит вам деньги без потери качества. На средних — Opus 4.8 даёт оптимальный баланс. Fable 5 окупается только там, где задача длинная, многошаговая и компаундится — миграции, автономный кодинг, deep research с persistent memory. На любых других сценариях вы платите за бренд флагмана, а не за прирост качества.

Дополнительная сложность для российских пользователей — выбор прокси. ProxyAPI с наценкой ~10% и проброшенным cache_control остаётся оптимальным вариантом для большинства задач. AITUNNEL — для тех, кому важен корпоративный договор и закрывающие документы для бухгалтерии.

И последнее: Anthropic очевидно использует Fable 5 как «дойную корову» — модель, на которой за полгода до релиза Sonnet 5 (вероятно, в конце 2026) Anthropic зарабатывает по премиальной цене. Для большинства команд правильная стратегия — подождать, остаться на Opus 4.8 или Sonnet 4.6, и пересмотреть выбор, когда выйдет новый Sonnet с частью качества Fable за треть цены.

Все три модели Claude — в одном API без VPN

Меняете model в запросе — выбираете Sonnet 4.6, Opus 4.8 или Fable 5. Prompt caching проброшен, оплата рублями, договор для юрлица, закрывающие документы. Тот же SDK, никакой миграции кода.

Открыть

Похожие статьи