CEO Notion Иван Чжао дал интервью, которое стоит прочитать каждому, кто строит продукт или работает с ИИ: о кастомных агентах, ценообразовании будущего и фразе, которую процитирова…
Создатель Redis написал инференс-движок для DeepSeek v4 Flash — и он работает на ноутбуке
Antirez выпустил ds4 — нативный инференс-движок для DeepSeek v4 Flash с 1M контекстом, который запускается локально на Mac со 128 ГБ RAM.
Antirez — человек, который создал Redis — выложил ds4: нативный инференс-движок, заточенный под DeepSeek v4 Flash. И это не очередной обёртка над llama.cpp — он переписал архитектуру с нуля.
Главный трюк: KV-кеш перенесён из оперативки на SSD. Это позволяет запускать модель с окном в миллион токенов локально на Mac со 128 ГБ RAM через специальную 2-bit квантизацию. DeepSeek v4 Flash — это почти фронтирная модель, которая отлично работает в агентных циклах. Теперь для этого не нужен облако.
Почему это круто: компании тратят миллиарды на GPU-кластеры, а один разработчик запускает сопоставимый по уровню ИИ на ноутбуке. Open-source продолжает сокращать разрыв с закрытыми моделями — и ds4 один из самых ярких примеров того, как хакерская культура переписывает правила.
По теме
- Статья: Minimax M2.7 на Mac Studio: 120 000 токенов контекста и живой код — рассказ Миши
- Блог: Grok 4.3 в xAI API: 1M контекста, лидер по tool calling и цена ниже флагманов
- База знаний: Codex от OpenAI — новая стандартная среда для работы с ИИ-агентами
Если вы думаете над локальным запуском моделей для своих задач и хотите понять, когда это имеет смысл, а когда проще остаться в облаке — это как раз та тема, где стоит разобраться. Если захотите обсудить, как это применить у себя или в команде — пишите в Telegram @pimenov