У Paperclip — open-source платформы для оркестрации ИИ-агентов — появилась полноценная документация от комьюнити. Разбираюсь, почему это важнее, чем кажется.
Codex, Саркис и два месяца боли: как я наконец-то собрал рабочую инфраструктуру ИИ-агентов
Личный рассказ: почему 90% проблем с агентами — это вопрос правильных «мозгов», как я связал Codex и OpenClaw через MCP и что из этого вышло на практике, включая аудит Яндекс.Диска на 2 ТБ.
Я просыпался как рыбка
Представьте: 6:34 утра, я только лёг. На компьютере открыто четыре чата с разными агентами. На VPS-сервере крутится OpenClaw. В соседней вкладке — Hermes, который я неделю назад пытался укротить. Где-то рядом тестовый Minimax. И я честно не помню, на чём вчера остановился.
Я просыпался просто как рыбка, и у меня открыто 4 чатика, и я вообще не понимаю, на чём я вчера закончил.
Два месяца я бился с ветряными мельницами. Параллельные процессы, забытые ветки, хаос инструментов. Делал много, документировал каждый шаг — и всё равно к концу второго месяца наступил полный когнитивный перегруз.
А потом я нашёл одно простое решение, которое сняло 99% всех заморочек. Об этом и расскажу.
Главная ошибка, из-за которой ничего не работает
Когда я готовился к вебинару, целую неделю метался: как рассказать про агентов максимально просто. Чем глубже копал, тем сложнее становилось. И всё-таки одну вещь я могу сказать без оговорок.
90% всех проблем с ИИ-агентами — это одна-единственная ошибка. Неправильно выбранная модель в ядре.
Прямо в день вебинара мне в чат написал новый участник, Трой. Скриншоты: агент «забывает», глючит, не понимает простых вещей. Открываю последний скрин — и там написано: модель Minimax через OpenRouter, бесплатно.
Давайте по порядку, что тут не так.
Есть Minimax в API — настоящий, полноценный, оплаченный. И есть Minimax «open source», развёрнутый каким-то сторонним провайдером. Это не одна и та же модель. Такая «open-source»-версия может быть переразмещённой или модифицированной (дистилляция, квантование, другой чекпоинт), поэтому качество часто отличается. По сути это другая модель с тем же названием. И она бесплатная.
Если что-то где-то бесплатное — значит, продукт это вы.
И дальше — моя любимая аналогия:
Модель у агента — это мозги. Вы ему либо нормальные мозги вставляете, хорошие, качественные, профессиональные, либо вставляете ему сразу тупые, недоделанные, кривые. И, соответственно, дальше будет такой результат.
Можно сколько угодно настраивать скиллы, конфигурации и фреймворки. Если в основе лежит зажатая бесплатная модель, агент будет тупить, забывать и врать. Это не вопрос архитектуры. Это вопрос двигателя.
Что делать вместо этого (спойлер: 20 долларов)
Решение настолько простое, что мне даже неловко его озвучивать. Но я повторю его столько раз, сколько нужно.
Найдите 20 долларов в месяц и оплатите подписку ChatGPT. И забудьте про все API-ключи, про тесты других моделей.
Подписка даёт доступ к топовым моделям OpenAI (флагману на текущий момент). Работайте через подписку и вход в аккаунт, а не через API-ключи и внешние прокси. И двигайтесь дальше.
Может, попробовать что-то подешевле? — спросите вы. Я попробовал. Я пробовал OpenRouter, я пробовал бесплатные раздачи, я пробовал поднимать локальные модели. Каждая такая попытка стоила мне нескольких дней жизни.
Не ищите, не пытайтесь сэкономить эти 20 долларов. Вы потратите огромное количество сил, времени и нервов.
Про Claude отдельно. Я его в принципе люблю как модель, но Claude Code однажды сожрал у меня недельный лимит за три минуты — просто пытаясь сделать аудит файловой системы. Плюс жёсткие лимиты, плюс блокировки российских пользователей. Поэтому:
Про Клод, я считаю, нужно просто забыть.
Codex — то самое открытие, которое поменяло всё
Первые два месяца я жил в OpenClaw на VPS-сервере. Telegram-бот, чатики, скиллы, бесконечный конструктор. Это работало. Но это было тяжело.
А потом я наконец-то открыл Codex от OpenAI. И понял, что искал именно его.
Codex — это агент OpenAI для разработки, который входит в ту же подписку ChatGPT за 20 долларов. Он у вас уже есть, если у вас есть подписка. Левый верхний угол ChatGPT, ссылка на Codex. Или сразу chatgpt.com/codex.
Что он умеет:
- Может работать с проектным окружением — файлами проекта, запуском команд, браузером и доступом к внешним серверам (в пределах настроенных разрешений).
- Память фиксируется в артефактах проекта — заметках и файлах (например, Markdown), которые можно открыть, прочитать и поправить руками.
- Те же мозги — GPT-5.5, но заточенный под разработку.
- Работает с проектами, а не с чатиками.
Я долго откладывал переход на Codex. Психологический барьер: я привык к чатикам — Telegram, OpenClaw. А Codex — это проекты. Как только я переломил это восприятие — всё встало на место.
Кейс Ольги
Ко мне на консультацию пришла Ольга. Хотела обновить свой сайт на WordPress. Не могла справиться с этой задачей много лет. Мы подключили Codex к её хостингу. Через два часа она прислала скриншот.
Codex сам зашёл, разобрался и сделал новый сайт.
Это то, что она не могла сделать там, я не знаю, много лет — и сделала за два часа.
Это не «вау-эффект» ради вау-эффекта. Это смена парадигмы. Вы перестаёте быть человеком, который собирает интерфейсы руками. Вы становитесь человеком, который ставит задачи.
Связка Codex + Саркис: когда два агента договариваются между собой
Дальше начинается самое интересное. У меня уже был Саркис — это мой OpenClaw-агент на VPS-сервере, к которому я долго прикручивал интеграции. Почта, календарь, Яндекс.Диск, Telegram, что только не.
Вопрос: как подружить Codex (локально) и Саркиса (на сервере)?
Ответ: MCP — Model Context Protocol. Протокол интеграции, через который я дал Codex доступ к инструментам Саркиса. Я не писал ни строчки кода руками — я просто попросил Codex настроить связь с Саркисом.
Codex и Саркис сами сделали нужные конфиги и куски кода для интеграции. И дальше произошло вообще волшебство.
Схема получилась такая:
Я → Codex (оркестратор) → Саркис (исполнитель с доступами) → Внешние сервисыКак это устроено технически:
- VPS у провайдера — там живёт Саркис.
- SSH-ключ настраивается в админке провайдера один раз.
- Codex получает доступ по SSH к серверу через этот ключ (в идеале — отдельный пользователь, а
sudoтолько по необходимости). - MCP-сервер Саркис поднял сам и выдал Codex'у токен (ключ) доступа.
- У них появился свой «чатик» — без моего участия.
Дальше я просто сижу в чате Codex'а и ставлю задачи. Если Codex'у что-то нужно сделать на сервере — он пишет Саркису. Тот делает и возвращает результат.
Аудит Яндекс.Диска: как агенты разобрались с моим цифровым хламом
Это я показывал в живой демонстрации на вебинаре. Покажу и здесь — словами.
У меня Яндекс.Диск на 2 терабайта. Я туда годами складывал всё подряд: расшифровки консультаций, видео с Телемоста, какие-то архивы, фотографии. И не понимал, что там вообще лежит. Каждый раз, когда место заканчивалось, я тупо докупал ещё место на диске.
Когда-то давно я уже подключал Саркиса к Яндексу — для другой задачи, чтобы он автоматически сохранял записи консультаций. Эта интеграция была сделана один раз для одной задачи. Но доступ-то остался.
Я один раз это сделал. Это вот к вопросу инфраструктуры.
И вот ключевой момент. Я не пошёл делать новую интеграцию Codex'а с Яндексом. Я сказал Codex'у: «Пойди через Саркиса. У него уже есть доступ».
Я не начинаю городить новую интеграцию Codex'а. Я вспоминаю, что у Саркиса уже есть.
Дальше я лёг спать. Codex и Саркис полтора часа работали в паре. Утром я открыл отчёт и увидел конкретные папки-«монстры». Один из заголовков отчёта я запомнил дословно:
Думал тут гигабайт, а тут 500 гигабайт.
Годами я был в плену собственных «цифровых Авгиевых конюшен». Двум агентам понадобилось полтора часа, чтобы разгрести это.
Безопасность: единственная вещь, на которой нельзя экономить
Есть одна история, которую я люблю рассказывать на вебинарах. Руководитель отдела безопасности ИИ в компании Meta подключила OpenClaw с полными правами к своей почте. Агент удалил всю переписку.
Всё, куда вы что-то подключаете с полными правами — вам может всё удалить.
Это не вина агента. Агент сделал то, на что ему дали права. Это вопрос архитектуры доступа.
Моя стратегия простая:
- Давать доступ только туда, где данные продублированы или потеря некритична.
- Использовать фаервол на уровне провайдера (сетевые правила/группы безопасности; у меня Timeweb).
- Жить на подписке, а не на API-ключах — без моего физического подтверждения с аккаунтом ничего серьёзного не сделать.
Что я понял за эти два месяца
Если коротко — в голове должно быть инфраструктурное мышление. Не «сделать задачу», а «выстроить систему, в котором задачи решаются сами».
Вот мои принципы, к которым я пришёл:
- Три копии каждого проекта: компьютер → сервер → GitHub.
- Два формата каждого документа: Markdown для людей и JSON для агентов.
- Каждый шаг документируется — Codex делает это сам, я не вмешиваюсь.
- Один раз настроенная интеграция — это актив, а не разовая задача. Запоминайте, кому что разрешено.
- Один агент-оркестратор + специализированные исполнители, а не зоопарк отдельных чатиков.
А если у меня нет Яндекса и нет своего сервера? — Каждый строит инфраструктуру под себя. Принципы те же, инструменты могут быть любые.
С чего начать прямо сейчас
Если вы только заходите в эту тему — пожалуйста, не повторяйте моих ошибок.
Если вы сейчас на старте — нужно 30 раз подумать перед как, как что-то начинать.
Конкретные шаги:
И главное
Я потратил два месяца на хаос, чтобы вы могли пройти этот же путь за неделю.
Очень хочу, чтобы вы этих дров не наломали. Вот я наломал — вы не наломайте.
Три слова, на которых всё держится:
Платите. Стройте. Делегируйте.
Платите за нормальные мозги агента — без этого никакая архитектура не спасёт. Стройте инфраструктуру с переиспользуемыми правами и интеграциями. Делегируйте агентам всё, что можно делегировать, — и освобождайте себе время на то, что умеете только вы.
По теме
- Статья: Два агента лучше одного: как связать OpenClaw и Hermes Agent в единую систему
- Блог: Почему OpenClaw — это не просто ещё один агент, а ваш цифровой напарник
- База знаний: OpenAI Codex — облачный coding-агент для параллельной разработки
Если вы сейчас на той же стадии, где я был два месяца назад — куча агентов, чатов и серверов, и никакой ясной картины — иногда быстрее сесть и разобрать ваш конкретный контур вместе, чем ломать его в одиночку.