GPT-5.5 вышла — OpenAI снова двигает планку и ставит на агентов

OpenAI выпустила GPT-5.5 — модель, которая быстрее понимает задачу, сама планирует шаги и доводит работу до конца. Разбираюсь, что реально изменилось и почему это важно.

ИИ-агентыИнструменты

23 апреля OpenAI выпустила GPT-5.5 — и назвала её «новый класс интеллекта для реальной работы». Звучит как маркетинг? Возможно. Но если посмотреть на то, что модель реально умеет, становится ясно: это не просто очередной апгрейд цифры в названии.

Так что конкретно произошло

GPT-5.5 — это модель, которая лучше понимает, что вы пытаетесь сделать, и может взять на себя больше работы. Код, исследования, анализ данных, создание документов, навигация по интерфейсам — всё это теперь в одном контуре. Вы даёте ей сложную, многоступенчатую задачу, а она сама планирует, использует инструменты, проверяет результат и продолжает, пока не закончит.

При этом модель не стала медленнее. OpenAI заявляет, что GPT-5.5 работает с той же скоростью, что и GPT-5.4, но при этом тратит меньше токенов на выполнение тех же задач. То есть стала и умнее, и экономичнее — редкое сочетание.

Кодинг — главная витрина

На бенчмарке Terminal-Bench 2.0 (сложные сценарии в командной строке) модель показала 82.7% — лучший результат среди всех моделей. На SWE-Bench Pro — 58.6%. На внутреннем тесте OpenAI Expert-SWE, где медианное время решения для человека-эксперта составляет 20 часов, GPT-5.5 тоже обошла предшественницу.

Один из инженеров NVIDIA, получивших ранний доступ, сказал буквально: «Потерять доступ к GPT-5.5 — как если бы мне ампутировали конечность». Звучит драматично, но когда модель самостоятельно разруливает ветку с сотнями изменений за 20 минут — понятно, почему.

Cursor уже подтвердили: модель заметно умнее GPT-5.4 и дольше держит контекст без ранней остановки.

Не только код — вся «работа за компьютером»

OpenAI делает акцент на том, что GPT-5.5 — не просто кодер-модель. Она хороша в том, что они называют knowledge work: найти информацию, понять, что важно, собрать отчёт, подготовить презентацию, автоматизировать рутину.

Внутри самой OpenAI более 85% сотрудников используют Codex каждую неделю — и это не только инженеры. Финансисты обработали почти 25 тысяч налоговых форм (71 637 страниц), ускорив задачу на две недели. Команда коммуникаций построила автоматического Slack-агента для обработки запросов на выступления.

На бенчмарке OSWorld-Verified (модель управляет реальным компьютером) GPT-5.5 набрала 78.7%. На GDPval (знаниевая работа в 44 профессиях) — 84.9%.

Наука тоже в игре

Отдельно интересно: GPT-5.5 помогла найти новое доказательство про числа Рэмси — одну из ключевых задач в комбинаторике. Доказательство потом верифицировали в Lean. Иммунолог из Jackson Laboratory с помощью GPT-5.5 Pro проанализировал датасет из 62 образцов и почти 28 000 генов — работа, которая заняла бы его команду несколько месяцев.

Кому доступно и сколько стоит

GPT-5.5 уже раскатывается на подписчиков Plus, Pro, Business и Enterprise в ChatGPT и Codex. GPT-5.5 Pro (с расширенным reasoning) — для Pro, Business и Enterprise. API пока нет, но обещают «очень скоро».

Пара нюансов, прежде чем бежать тестировать

OpenAI подчёркивает, что у GPT-5.5 усиленные safeguards, особенно в области кибербезопасности. Модель стала настолько хороша в нахождении уязвимостей, что пришлось закрутить гайки на стороне ограничений. Некоторые пользователи могут заметить, что определённые запросы стали строже модерироваться.

Ещё один момент: модель обучена и обслуживается на NVIDIA GB200 и GB300 NVL72. Причём сама GPT-5.5 помогала оптимизировать инфраструктуру, которая её обслуживает — балансировка нагрузки дала прирост скорости генерации токенов более 20%.

Что это значит на практике

GPT-5.5 — это модель, после которой возвращаться на предыдущую версию будет больно. Не из-за маркетинга, а потому что она реально меняет рабочий процесс: меньше ручного контроля, меньше итераций, меньше «объясни ещё раз». Если вы уже используете Codex или ChatGPT для работы — обновление стоит попробовать в первый же день.

По теме

Если вы строите рабочие процессы вокруг ИИ и хотите понять, как GPT-5.5 впишется именно в вашу систему — давайте разберёмся вместе.