Cloudflare Agents SDK — фреймворк для stateful AI-агентов поверх Durable Objects: каждый агент — отдельный «микросервер» с SQLite, WebSocket, планировщиком и hibernation. Разбираем…
Autoresearch от Karpathy: мини-репозиторий, чтобы «научить» агента улучшать обучение LLM
Короткая заметка о том, как устроен autoresearch: вы правите «программу» агента в .md, агент правит тренировочный .py, а все эксперименты сравнимы, потому что каждый прогон длится фиксированные 5 минут.
Иногда хочется пощупать ML-ресерч руками, но без «инфраструктурного ада»: десятки конфигов, кластер, очереди, метрики, полдня на то, чтобы просто получить первый график.
Andrej Karpathy выложил очень показательный минимальный проект autoresearch: идея в том, чтобы у вас был маленький, но настоящий цикл обучения LLM, и рядом агент, который сам крутит гипотезы и фиксирует улучшения.
Что там интересного
- Тренировка сведена к одному файлу и рассчитана на одну GPU. Порог входа сильно ниже: вы можете прочитать код целиком, а не «верить в фреймворк».[1]
- Есть разделение ролей:
- человек итеративно уточняет «программу» агента в .md
- агент итеративно меняет тренировочный .py
- Самое важное инженерное решение: каждый эксперимент длится фиксированные 5 минут. Это делает сравнение честным. Не нужно гадать, что улучшение произошло потому, что один запуск учился 2 часа, а другой 10 минут.[2]
Зачем вам это читать, если вы не ML-исследователь
Потому что это хороший «учебный стенд» для агентных систем.
Если вы хотите, чтобы агент реально улучшал что-то в коде или пайплайне, вам нужен:
- узкий и понятный пространство изменений (что именно можно менять)
- измеримый сигнал качества (что считается улучшением)
- сопоставимые прогоны (одинаковая длительность, одинаковые условия)
В autoresearch всё это есть, и это можно переносить на любые прикладные циклы: от оптимизации промптов до автотюнинга ETL или моделей ранжирования.
Где смотреть первоисточник
- Репозиторий: https://github.com/karpathy/autoresearch
По теме
Я люблю такие «минимальные песочницы»: они быстро показывают, где у агента реально появляются улучшения, а где он просто производит движение.
Если хотите разобрать свою задачу — напишите мне Если хотите разобрать свою задачу — напишите мне.
Можно прийти с идеей, черновым контекстом или уже живой задачей. Помогу быстро понять, где реальный следующий шаг, а где лишний шум.
Обычно хватает 2–3 сообщений, чтобы понять, могу ли я здесь реально помочь и в каком формате лучше двигаться дальше.
Связанные материалы
Окно возможностей, которое открывается раз в поколение, сейчас распахнуто настежь. Ноутбук, подписка на Claude и пара часов в неделю — вот и весь список требований. Разбираюсь, поч…
10-летний ютубер купил Mac Studio, чтобы запускать ИИ-агентов. Китайский интернет разделился: одни восхищены, другие жалеют ребёнка