Миф про Mythos?
Всё нижеизложенное суть исключительно моё личное мнение, которое сложилось из чтения новостей, технических отчётов и общения в чатиках. Я, к сожалению не работаю в Anthropic и посему не имею доступа к внутренней кухне, короче могу ошибаться, но если я прав, то получается занятная история.
Издалёкое начало
Начнём, как грица, с начала, 7 апреля 2026 года Anthropic анонсировала Project Glasswing и модель Claude Mythos Preview, которую компания описала как: by far the most powerful AI model we've ever developed (сильное заявление.jpg).
Со слов авторов Mythos способен находить zero-day уязвимости во всех ОС и браузерах, писать эксплойты, применять их, выходить из чрута и так далее. Полный отчёт прям красивенький, так как во время тестов было выявлено десятки тысяч багов, среди которых 27-летняя уязвимость в OpenBSD.
Но я калач тёртый, зацепился за название, странное оно какое-то, само по себе Mythos (читается как Мифос) это же Миф, то есть слово, которое буквально означает вымысел, легенду, сказку. Оно вызывало воспоминания о книгах про маркетинговый мифодизайн из чертогов моего разума, которые мне довелось прочесть два десятилетия назад.
Немного про мифодизайн
Есть отличная книга Александра Ульяновского "Мифдизайн: коммерческие и социальные мифы", где подробно разбирается, как реклама превращает обычный товар в смысловой "миф", который потребитель покупает охотнее. Классический пример - порошок "Миф", полагаю все кому немного за тридцать её видели по телеку и не раз, и помните Мойдодыра этого крипового.
Само слово эксплуатирует понятие легенды, чуда или сказки, перенося это ощущение на продукт. Реклама создаёт ритуал - не просто "стирает", а "легендарная морозная свежесть", магическое действие, борьба добра (чистоты) со злом (грязью).
Когда я увидел название Mythos, мысль пришла мгновенно - а что, если Anthropic сделала ровно то же самое? Взяли существующий продукт, обернули его в смысловой миф о "самой мощной модели", и теперь продают не технологию, а легенду?
Почему я так подумал...
Harness всё решает
OpenAI в начале 2026 года выпустила пост "Harness Engineering. Leveraging Codex in an Agent-First World", где описала, как их команда из трёх человек за пять месяцев сгенерировала миллион строк кода без единой строки, написанной человеком.
Harness - это не модель или агент, ну, как мы привыкил, это инфраструктура, цикл планирования, вызов тулов, песочница, верификация, память, логика повторов, задачи по расписанию. Именно harness определяет, насколько эффективно агент будет решать задачи, а моделька в чистом виде уже не так важна, хотя она и вносит самый весомый вклад в такие системы.
На волне этой идеи начали появляться и развиваться системы вроде OpenClaw хайпанувная на страрте, потом появился Hermes Agent от NousResearch, и тысячи других. Все они делают примерно одно - берут существующую LLM, реализуют ReAct-агента, оборачивают всё это в инфраструктуру, которая позволяет агенту планировать, использовать инструменты, исполнять код и помнить контекст.
И вот тут у меня встал вопрос (угу, отсылочка), а что, если Mythos - это не новая модель, а именно harness?
Почему я скептик
Есть несколько факторов, которые складываются в эту гипотезу.
Во-первых
Среди множетсва результатов независимых проверок и оценок экспертов частенько мелькают и скептические оценки, вот некоторые из них.
Ян Лекун, один из "отцов ИИ", не стал церемониться и назвал заявления Anthropic "BS from self-delusion". По его мнению, более мелкие модели уже способны выполнять те же задачи.
Дэниел Стенберг, автор curl, прогнал Mythos на своей кодовой базе, по его словам модель не показала существенных преимуществ по сравнению с другими AI-продуктами.
Tom's Hardware выпустил разбор с красноречивым заголовком - "Anthropic's Claude Mythos isn't a sentient super-hacker, it's a sales pitch". Журналисты указывают, что заявления о "тысячах" zero-day основаны всего на 198 ручных проверках, причём многие найденные "уязвимости" - это либо старый софт, либо проблемы, которые "не являются критическими" и "сложно превратить в работающий эксплойт". Даже в отчёте Anthropic признаёт, что нашедшийся 16-летний баг в FFmpeg "в конечном итоге не является критической уязвимостью".
Брюс Шнайер, легенда кибербеза, писал что компания Aisle Security смогли найти несколько найденных Mythos багов с помощью старых и дешёвых публичных моделей.
Стивен Свифт из Suzu Labs выразился ещё прямее - "Anthropic knows what they're doing. They're making big claims, because attention is good for their business model... providing just enough detail so that the claims look convincing at first glance".
Во-вторых
Я давно подозреваю, что Anthropic (да и OpenAI пожалуй тоже) перестали обучать модели с нуля ещё после Opus 4, так как обучение с нуля - это задача на порядки более сложная и дорогая, чем тюнинг. Сменить токенайзер, дообучить на новых данных, сделать RLHF - это всё ещё "тюн", а не "новая модель". Yandex, Вихрь и ruAdapt показали, как можно адаптировать модели под новый язык без полного переобучения. Так почему бы не сделать то же самое, но прикрутить к модели харнес и назвать результат "исследовательским интеллектом выше PhD"?
В-третьих
Вся "cyberpower" Mythos идеально укладывается в harness + тулы:
- Агент получает доступ к публичным базам уязвимостей (CVE, NVD, Exploit-DB)
- В промптах отключены защиты от prompt injection, что позволяет агенту "думать" более агрессивно
- Harness (вероятно это Claude Code или его кастомная версия) организует ReAct петлю типа: сканирование -> поиск по базам -> генерация PoC -> проверка в песочнице
- Модель "находит" уязвимости, которые уже известны или являются тривиальными вариациями известных паттернов
При этом настоящие zero-day - те, о которых никто не знает - такой системой вероятнее всего найти не получится. Потому что LLM не обладают способностью к мышлению вне своего обучающего корпуса (так я говорю, поскольку считаю эмерджентность вариацией на тему галлюцинаций), зато они хорошо могут комбинировать уже известные факты и знания.
В-четвёртых
Сама схема релиза Project Glasswing подозрительно похожа на контролируемый доступ к дорогому API-продукту, а не на распространение новой технологии. $100 млн на кредиты, ограниченный доступ для 40+ организаций, "слишком опасно для публики" - это классическая схема создания мифа, искусственного дефицита и эксклюзивности.
Когда продукт действительно крутой, его стараются продать как можно большему числу клиентов, а когда продукт - в основном маркетинговый миф - его обычно продают "по приглашениям", специалистам которые не обладают достаточной экспертизой и не смогут проверить заявления.
Спекуляции на тему
Если собрать всё воедино, получается любопытная картина, Anthropic взяла существующую модель (вероятно Opus 4.7, ну или тюн какой неполиткорректный), обернула её в кастомный harness с доступом к ИБ-базам и инструментам анализа кода, сняла некоторые safety-ограничения - и назвала это Mythos.
Само название при этом ИМХО работает как намёк, добрым молодцам урок, не модель, а миф о модели.
Как порошок "Миф" не делал стирку магической, но продавал ощущение магии - так и Mythos, возможно, не делает ничего принципиально недоступного конкурентам, но продаёт ощущение недостижимого превосходства.
И это, кстати, не умаляет достижения. Если Anthropic на самом деле построила мощную систему поиска уязвимостей на базе агентной архитектуры - это круто. Но называть это "новой моделью, слишком опасной для публики" - это уже мифодизайн.
PS. Рынок, судя по всему, купился. Акции кибербезопасности упали после "утечки" в марте. Правительства созывают совещания. Эксперты спорят о "новой эре". А между тем, любой разработчик с доступом к Claude Code, паре MCP-серверов и публичным базам CVE может собрать систему, которая будет находить известные классы уязвимостей в том же режиме. Просто у него не будет бюджета на $100 млн маркетинга и имени "Mythos".
PPS. Если через полгода Anthropic вдруг выпустит Mythos в публичный доступ без существенных изменений - знайте, что "опасность для общества" оказалась не страшнее очередного тюна квена, а если так и останется за семью печатями - то это вероятно будет ещё одно подтверждение тезиса, миф существует лишь до тех пор, пока его не проверят профильные специалисты используя научный метод.
mythos
миф
ии
harness
anthropic