MiniMax M3 — открытые веса, миллион токенов и работа за компьютером

Сегодня MiniMax выложили M3 — китайскую открытую модель, которая замахивается на ту же лигу, где сидят Claude и GPT для кода и агентов. Интересна она не очередной гонкой бенчмарков, а сочетанием трёх вещей в одной голове: серьёзный кодинг, миллион токенов контекста и нативная мультимодальность с поддержкой картинок, видео и работы за компьютером. До этого все три фишки одновременно жили только в закрытых моделях.

Под капотом — новая архитектура MiniMax Sparse Attention. Модель смотрит на длинный контекст выборочно, выхватывая только нужное. За счёт этого на миллионе токенов она реально летает и не вязнет, как обычные длинноконтекстные модели. Именно это и нужно для долгих агентных сценариев, когда часами тянешь код, логи и историю задачи в одном окне.

Доступна M3 уже сейчас и сразу в нескольких контурах. Веса скоро будут открыты на HuggingFace и GitHub, модель работает через API MiniMax и в их собственном агентном продукте MiniMax Code. А ещё, что лично мне особенно интересно, она официально лицензирована в Ollama Cloud для коммерческого использования. То есть поставить M3 себе в работу можно уже сегодня, без ожиданий.

У меня модели MiniMax стоят в клиентских агентах на Hermes и я ими доволен, особенно на длинных tool-цепочках, где другие модели начинают терять контекст. M3 выглядит как естественное продолжение этой линии: тот же стиль, тот же характер, плюс честный длинный контекст и возможность поднять локально под клиентский контракт.

По теме

Если строите агентов на open-weight моделях и думаете про MiniMax под клиентские задачи, могу поделиться, как мы интегрируем их в Hermes и где модель проседает на длинных сценариях.

Если захотите обсудить, как это применить у себя или в команде — пишите в Telegram @pimenov

MiniMax M3 — открытые веса, миллион токенов и работа за компьютером

По теме

Если хотите разобрать свою задачу — напишите мне Если хотите разобрать свою задачу — напишите мне.

Если хотите разобрать свою задачу — напишите мне