OpenAI выпустил крупнейшее обновление Codex: агент теперь видит экран, кликает и печатает в любых приложениях Mac. Разбираюсь, почему это меняет правила игры.
ChatGPT Images 2.0 — OpenAI наконец сделал текст на картинках читаемым
OpenAI выпустил ChatGPT Images 2.0 на базе GPT-Image-2 — с почти идеальным рендерингом текста, реалистичными UI-скриншотами и заметным скачком в фотореализме. Разбираюсь, что изменилось и почему это важно.
Сегодня OpenAI выкатил ChatGPT Images 2.0 — новую версию генератора изображений на базе модели GPT-Image-2. И впервые за всю историю ИИ-генерации картинок можно сказать: текст на изображениях наконец работает нормально.
Так что конкретно изменилось
GPT-Image-2 — это следующая итерация после GPT Image 1.5, которую выпустили в декабре 2025-го. Главный прорыв — рендеринг текста внутри изображений. То, что раньше было болью каждого, кто пытался сгенерировать мокап, постер или карточку товара: буквы плыли, слова путались, пунктуация жила своей жизнью.
Теперь — многострочные надписи, кнопки, заголовки, подписи на графиках — всё это генерируется почти без ошибок. Для тех, кто использует ИИ-генерацию в рабочих процессах, это не «ещё одна фича», а переход из категории «игрушка» в категорию «инструмент».
Что ещё под капотом
Реалистичные UI-скриншоты. Модель теперь может генерировать изображения, которые выглядят как настоящие интерфейсы — окна браузера, мобильные приложения, дашборды. Не пиксель-перфект, но достаточно, чтобы показать идею клиенту или вставить в презентацию.
Скачок в фотореализме. Текстуры, освещение, руки и лица — всё стало заметно лучше. Меньше артефактов, более естественные материалы, корректная перспектива.
Точнее следует инструкциям. Сложные промпты с несколькими объектами, конкретными цветами и расположением элементов теперь отрабатывают значительно точнее. Разрыв между тем, что вы просите, и тем, что получаете, стал меньше.
Что это значит на практике
Если раньше ИИ-генерация картинок годилась в основном для фоновых иллюстраций и стоковых замен, то с GPT-Image-2 открываются конкретные рабочие сценарии:
- Маркетинг: автоматическая генерация креативов для соцсетей и рекламы с точным текстом — заголовками, CTA, ценами
- Продуктовые мокапы: превью интерфейсов и упаковки до стадии дизайна
- Контент-пайплайны: визуалы для блогов, рассылок и презентаций без дизайнера
Отдельно стоит отметить: модель уже доступна всем пользователям ChatGPT и, судя по всему, скоро появится в API. А значит — её можно будет встроить в любой автоматизированный контур.
А как насчёт конкурентов
Midjourney по-прежнему сильнее в художественных стилях и эстетике. FLUX и Stable Diffusion дают больше контроля для технических пользователей. Но если вам нужен надёжный рабочий инструмент, где текст на картинке — это не лотерея, а норма, GPT-Image-2 сейчас выглядит как лучший вариант.
Google Imagen 3 конкурирует по фотореализму, но именно по рендерингу текста OpenAI, похоже, вырвался вперёд.
Коротко
ChatGPT Images 2.0 — это не революция в стиле «всё изменилось за ночь». Это логичный, но очень конкретный шаг: текст на картинках теперь работает, UI-мокапы стали реалистичнее, промпты отрабатывают точнее. Для тех, кто строит автоматизированные контент-процессы — это тот апдейт, которого ждали.
По теме
- Статья: Полный гайд по промптингу Seedance 2.0 — камера, свет, движение и 5-слойная структура, которая работает
- Блог: Codex вышел за пределы терминала — теперь он кликает мышкой
- База знаний: Pencil — агентный дизайн-канвас с MCP прямо в IDE
Если вы уже используете ИИ-генерацию в своих процессах и хотите понять, как встроить GPT-Image-2 в контур от промпта до публикации — давайте обсудим.