Claude Mythos Preview: первая ИИ-модель, успешно прошедшая сложную симуляцию кибератаки

Британский AI Security Institute (AISI) объявил о достижении ИИ-модели Claude Mythos Preview, которая впервые самостоятельно прошла 32-этапную симуляцию корпоративной кибератаки под названием The Last Ones (TLO). Эта сложная имитация включает все стадии атаки: разведку, получение первичного доступа, кражу учетных данных из браузеров, перемещение по хостам, эксплуатацию веб-приложений, эскалацию привилегий, реверс-инжиниринг командно-контрольного трафика и окончательный захват сети.
По данным института, на выполнение такого задания у человека-эксперта уходит около 20 часов. Mythos смог завершить полный сценарий в 3 из 10 запусков и в среднем проходил до 22-го шага, значительно опережая ближайшего конкурента Claude Opus 4.6, который доходил лишь до 16 шага. Более ранняя версия Claude Sonnet 3.7 не преодолевала даже первую фазу разведки.
В параллельных тестах по capture-the-flag (CTF) на экспертном уровне Mythos достиг 73% успеха, на уровне новичков — около 87%, а в задачах для технических неспециалистов — 97%. При этом производительность ограничивалась не возможностями модели, а бюджетом инференса, и при увеличении лимита токенов результаты продолжали улучшаться.
Однако модель показала ограничения на втором полигоне AISI — Cooling Tower, имитирующем промышленную систему управления. Mythos не справился с задачей, застряв на обычных IT-этапах, что подчёркивает сложность реальных систем, где присутствуют активные защитники и средства детектирования.
AISI отмечает, что существующие учебные полигоны слишком просты и не позволяют различать лучшие модели — Mythos, Opus 4.6 и GPT-5.4 почти достигли потолка эффективности. В будущем институт планирует усложнить тесты, добавив активный мониторинг и системы обнаружения атак, а также начать оценку ИИ на реальных системах.
P.S. Поддержать проект можно, подписавшись на канал «сбежавшая нейросеть», где рассказывается о творческих аспектах ИИ.