Создатель Redis написал инференс-движок для DeepSeek v4 Flash — и он работает на ноутбуке

Antirez выпустил ds4 — нативный инференс-движок для DeepSeek v4 Flash с 1M контекстом, который запускается локально на Mac со 128 ГБ RAM.

ИИ-агентыИнструменты

Antirez — человек, который создал Redis — выложил ds4: нативный инференс-движок, заточенный под DeepSeek v4 Flash. И это не очередной обёртка над llama.cpp — он переписал архитектуру с нуля.

Главный трюк: KV-кеш перенесён из оперативки на SSD. Это позволяет запускать модель с окном в миллион токенов локально на Mac со 128 ГБ RAM через специальную 2-bit квантизацию. DeepSeek v4 Flash — это почти фронтирная модель, которая отлично работает в агентных циклах. Теперь для этого не нужен облако.

Почему это круто: компании тратят миллиарды на GPU-кластеры, а один разработчик запускает сопоставимый по уровню ИИ на ноутбуке. Open-source продолжает сокращать разрыв с закрытыми моделями — и ds4 один из самых ярких примеров того, как хакерская культура переписывает правила.

По теме

Если вы думаете над локальным запуском моделей для своих задач и хотите понять, когда это имеет смысл, а когда проще остаться в облаке — это как раз та тема, где стоит разобраться. Если захотите обсудить, как это применить у себя или в команде — пишите в Telegram @pimenov