OpenAI выкатили GPT-5.5.
По факту, они пушат идею, что AI должен не только отвечать, а делать работу: кодить, дебажить, лазить по тулзам, искать инфу, анализировать данные, собирать документы и дожимать таски до конца. По сути, акцент уже не на “чатике”, а на агентности.
По бенчам там тоже всё довольно жирно. GPT-5.5 показал 82.7% на Terminal-Bench 2.0 против 75.1% у GPT-5.4, 58.6% на SWE-Bench Pro, 84.9% на GDPval, 78.7% на OSWorld-Verified и 98.0% на Tau2-bench Telecom. То есть OpenAI явно давит в сценарии, где модель должна не просто “знать”, а действовать: работать с компом, тулзами, сложными воркфлоу и длинными задачами.
Самый важный тейк вообще не в цифрах. OpenAI прямым текстом говорят: GPT-5.5 — это их “smartest and most intuitive to use model yet”, и главное улучшение в том, что он быстрее понимает, что ты вообще хочешь, лучше держит контекст, сам планирует шаги, чекает себя и меньше требует микроменеджмента со стороны пользователя. Что ближе к “дай задачу и отойди”, чем к старому доброму “пиши идеальный промпт на 600 слов”.
Из комментариев сэмы тоже
читается курс OpenAI:
— итеративный деплой как часть safety-стратегии;
— демократизация доступа к сильным моделям;
— ставка на то, чтобы AI был платформой для компаний, стартапов, учёных и вообще всех, кто хочет что-то строить.
Короче, посыл простой: мы не просто релизим модель, мы строим инфраструктуру, на которой дальше будут работать люди и бизнес.Ещё забавный штрих: промо-видео про GPT-5.5 на YouTube идёт 55 секунд
А ещё модель успела появиться в Codex… и спустя примерно 5 минут исчезла из интерфейса.
https://openai.com/index/introducing-gpt-5-5