OpenRouter запустил Fusion: запрос идёт сразу в несколько моделей, а отдельная модель сводит их ответы в один. Дешёвая панель обходит флагманы вдвое дешевле.
OpenAI открыла превью GPT-5.6: три модели Sol, Terra и Luna
OpenAI запустила ограниченное превью GPT-5.6: флагман Sol, сбалансированная Terra и быстрая Luna, новые режимы max и ultra и поэтапный доступ.
OpenAI открыла ограниченное превью новой линейки GPT‑5.6. Вместо одной модели сразу три, и у каждой своя роль:
- Sol — флагман, самый сильный на сегодня.
- Terra — сбалансированная модель на каждый день: по словам OpenAI, она не уступает GPT‑5.5, но при этом вдвое дешевле.
- Luna — быстрая и недорогая, с самой низкой ценой в семействе.
Заодно поменялась логика названий. Цифра теперь обозначает поколение, а Sol, Terra и Luna — это уровни мощности, каждый из которых может развиваться в своём темпе.
Так что конкретно умеет 5.6
Появились два новых режима рассуждений. max даёт Sol максимум времени, чтобы думать глубже. ultra идёт дальше одного агента и подключает суб‑агентов, чтобы ускорять сложную работу.
По бенчмаркам OpenAI показывает рост сразу в трёх направлениях:
- Код: новый рекорд на Terminal‑Bench 2.1, тесте на работу в командной строке с планированием и инструментами.
- Биология: на GeneBench v1 результаты выше GPT‑5.5 при меньшем расходе токенов.
- Кибербезопасность: на ExploitBench модель Sol сопоставима с Mythos Preview, тратя примерно треть токенов.
Безопасность и доступ
Вокруг киберспособностей OpenAI выстроила многослойную защиту и потратила больше 700 000 GPU‑часов (в эквиваленте A100) на автоматический ред‑тиминг, то есть поиск универсальных джейлбрейков. По их оценке, модель не переходит порог Cyber Critical.
Самое необычное в этом релизе — порядок выкатки. Превью стартует по согласованию с правительством США: сначала только для узкого круга проверенных партнёров через API и Codex, а широкий доступ в ChatGPT обещают в ближайшие недели.
Цены
За 1 млн токенов у Sol это 5 долларов на вход и 30 на выход, у Terra 2,5 и 15, у Luna 1 и 6. По нынешнему курсу выходит от нескольких рублей до пары сотен за обращение, в зависимости от модели и длины ответа. Появилось и более предсказуемое кэширование промптов: явные точки кэша и минимум 30 минут его жизни. А в июле Sol обещают запустить на Cerebras со скоростью до 750 токенов в секунду.
По теме
Статья: Почему я не использую Claude Code и сделал ставку на Codex
Блог: GLM-5.2: открытая флагманская модель с миллионом токенов и лицензией MIT
База знаний: OpenAI — линейка моделей GPT, Realtime и Images
Если вы выбираете, на какую модель ставить рабочий контур, история с тремя уровнями и поэтапным доступом стоит того, чтобы заранее прикинуть, что из этого реально дотянется до ваших задач.
Если захотите обсудить, как это применить у себя или в команде — пишите в Telegram @pimenov
Если хотите разобрать свою задачу — напишите мне Если хотите разобрать свою задачу — напишите мне.
Можно прийти с идеей, черновым контекстом или уже живой задачей. Помогу быстро понять, где реальный следующий шаг, а где лишний шум.
Обычно хватает 2–3 сообщений, чтобы понять, могу ли я здесь реально помочь и в каком формате лучше двигаться дальше.
Связанные материалы
История о том, как я вместе с Кодексом провел аудит семи VPS на TimeWeb: через API, read-only проверки, серверные паспорта, поиск уязвимостей, аккуратное усиление безопасности и во…
Docling — открытый инструмент IBM, который превращает PDF, Word, презентации и сканы в чистый Markdown и JSON для ИИ и RAG. Что умеет, как развернуть и как связать с Open WebUI.