Kimi K2.6 — опенсорсная модель, которая кодит 12 часов подряд и не теряет нить

Moonshot AI выпустила Kimi K2.6 — open-source модель с рекордным long-horizon кодингом, Agent Swarm на 300 агентов и поддержкой OpenClaw и Hermes. Разбираюсь, почему это важно.

ИИ-агентыИнструментыОбзор

Вчера Moonshot AI выложила в открытый доступ Kimi K2.6 — и это не просто очередной апдейт. Это модель, которая в тестах на длинный кодинг работала 12 часов подряд, делала больше 4 000 вызовов инструментов и при этом не сбивалась с курса. Для опенсорса — это новый уровень.

Что конкретно умеет

Главная фишка K2.6 — long-horizon coding. Модель уверенно справляется с задачами, которые длятся часами: оптимизация финансового движка на 4 000 строк кода, развёртывание и тюнинг LLM-моделей на Mac, сложные DevOps-сценарии. Причём не только на Python — Rust, Go, фронтенд тоже в деле.

На бенчмарках K2.6 идёт вровень с GPT-5.4 и Claude Opus 4.6 в кодинге (Terminal-Bench 2.0, SWE-Bench Pro), а кое-где и обгоняет. И всё это — в открытом доступе.

Agent Swarm — теперь до 300 агентов

Вторая большая история — Agent Swarm. K2.6 умеет декомпозировать задачу и раздавать её сотням специализированных подагентов, работающих параллельно. В K2.5 потолок был 100 агентов и 1 500 шагов. Теперь — 300 агентов и 4 000 шагов одновременно.

На практике это означает: вы даёте одну задачу — и получаете на выходе презентацию, датасет, 14 графиков и 40-страничный отчёт. Всё за один запуск.

Зачем это нам

K2.6 уже работает как движок в OpenClaw и Hermes Agent — двух проактивных агентах, которые умеют работать автономно 24/7. В тестах K2.6-агент отработал 5 дней без перерыва: мониторинг, инцидент-менеджмент, системные операции.

Отдельная штука — Claw Groups: несколько агентов (на разных моделях, с разных устройств) работают как единая команда. K2.6 выступает координатором — распределяет задачи, перераспределяет при сбоях, валидирует результат.

Пара нюансов

K2.6 доступен через Kimi API, на сайте kimi.com и в Kimi Code. Модель уже интегрирована в Ollama, CodeBuddy, OpenCode и ряд других платформ.

Если вы строите агентные пайплайны или ищете надёжную модель для длинных кодинг-сессий — K2.6 стоит попробовать. Для опенсорса это сейчас, пожалуй, самый серьёзный вариант.

По теме

Если вы уже используете агентные фреймворки и хотите понять, как встроить K2.6 в свою инфраструктуру — давайте обсудим.