Хотите передать SEO-задачи автономному агенту? Сначала дайте ему понять, кто вы и куда идёте. Без этого шага никакой инструмент не поможет.
Андрей Карпатый — один из тех людей, чьё мнение я отслеживаю в реальном времени. Бывший директор ИИ в Tesla, сооснователь OpenAI, человек, который придумал сам термин «вайб-кодинг». Когда он разбирает, куда движется программирование, — стоит слушать внимательно.
Недавно Карпатый подробно разложил, как меняется индустрия. И его картина мира совпадает с тем, что я наблюдаю на практике каждый день, работая с агентами. Вот ключевые тезисы — и мой взгляд на них.
Три эпохи: от строчки кода к одному промпту
Карпатый выделяет три парадигмы создания программ:
Software 1.0 — вы пишете каждую строку руками. Классическое программирование, алгоритмы, правила.
Software 2.0 — вы собираете данные, а нейросеть сама учится делать то, что нужно. Эпоха машинного обучения.
Software 3.0 — вы управляете нейросетью через промпты и контекстное окно. LLM стала компьютером, а промпт — программой.
Если перевести на бытовой язык: раньше вы писали подробную инструкцию для робота. Потом стали показывать роботу примеры. Теперь вы просто говорите роботу, что нужно сделать, и он разбирается сам.
Я вижу это каждый день. Мои агенты в Notion получают задачу текстом и выполняют её. Никакого кода, никаких датасетов. Только точное описание того, что нужно.
Так что конкретно разделяет вайб-кодинг и агентный инжиниринг
Карпатый сам придумал термин «вайб-кодинг» и сам же объясняет, почему его нельзя путать с профессиональной разработкой.
Вайб-кодинг поднимает нижнюю планку. Любой человек теперь может собрать работающее приложение, просто описав свои пожелания. Порог входа упал до нуля.
Агентный инжиниринг поднимает верхнюю планку. Это дисциплина для профессионалов: как координировать группу мощных, но непредсказуемых агентов, чтобы результат был надёжным и безопасным.
Разница принципиальная. Вайб-кодинг — это когда вы собрали MVP за вечер с помощью ChatGPT. Агентный инжиниринг — это когда у вас десять агентов обрабатывают клиентские данные и ни один не имеет права ошибиться.
По оценке Карпатого, специалисты в агентном инжиниринге получают ускорение, которое значительно превышает классическое понятие «10x разработчика». Я с этим согласен. У меня один контент-агент в Notion делает за минуту то, что раньше занимало полдня.
Зубчатый интеллект: гениальность и глупость через запятую
Одна из самых точных мыслей Карпатого — концепция «зубчатого интеллекта» (jagged intelligence). Модель может провести рефакторинг кода на сто тысяч строк или найти уязвимость нулевого дня, а через минуту ошибиться в количестве букв в слове «strawberry».
Почему так: лаборатории тренируют модели через обучение с подкреплением, где награда выдаётся за проверяемый результат. Код компилируется? Тест прошёл? Доказательство верно? Отлично, вот вознаграждение. Но «здравый смысл» проверить автоматически нельзя — и модели в нём стагнируют.
Есть ещё один фактор: способности модели напрямую зависят от данных, на которых её обучали. Резкое улучшение GPT-4 в шахматах связано с добавлением огромного массива партий в обучающую выборку. Стал ли GPT-4 от этого «умнее» в целом? Нет. Он стал лучше в шахматах.
Практический вывод для работы с агентами: вам нужно точно понимать, в какой зоне вы находитесь. Код, структурированные данные, аналитика — агент справится. Субъективные оценки, нюансы контекста, «что имел в виду клиент» — тут нужен человек.
Я столкнулся с этим на своём контент-пайплайне. Агент отлично переписывает тексты по чёткой инструкции. Но выбрать угол подачи для конкретной аудитории — до сих пор моя задача.
Нейросеть как операционная система — и почему это ближе, чем кажется
Карпатый предсказывает фундаментальный сдвиг в архитектуре вычислений. Сейчас нейросеть работает как приложение внутри обычного компьютера. В будущем — наоборот: нейросеть станет хост-процессом, а классический процессор будет выполнять вспомогательные детерминированные задачи.
Звучит далёким будущим, но зерно уже видно. Codex от OpenAI работает именно так: вы даёте задачу агенту, а он сам решает, какие инструменты запустить, какие файлы открыть, какие команды выполнить. Процессор — на подхвате.
Ещё одна мысль, которая мне кажется недооценённой: вся текущая цифровая инфраструктура создана для людей. Документация, интерфейсы, API — всё рассчитано на то, что их будет читать и использовать человек. Но если основным пользователем становится агент, инфраструктуру придётся переделывать.
Мы уже видим первые шаги: протокол MCP (Model Context Protocol) позволяет агентам напрямую взаимодействовать с сервисами. В моей системе агенты через MCP работают с Notion, GitHub и другими инструментами без промежуточного «человеческого» слоя. Это и есть начало «агент-нативной» инфраструктуры, о которой говорит Карпатый.
На примере проекта MenuGen он показывает ещё более радикальную вещь: нейросеть может напрямую модифицировать пиксели фотографии меню, делая разработку отдельного приложения бессмысленной. Зачем строить интерфейс между человеком и задачей, если агент решает задачу напрямую?
Какие навыки останутся за человеком
В мире дешёвого интеллекта ваши навыки трансформируются. Больше не нужно помнить синтаксис библиотек или разницу между PyTorch и NumPy — агент знает это лучше вас.
Зато критически важными становятся:
- Вкус и эстетика — понимание, что именно нужно создать и почему именно так
- Архитектурное мышление — как собрать систему из компонентов, чтобы она работала
- Надзор и верификация — проверка того, что агент сделал правильно
- Понимание контекста — зачем мы это делаем и для кого
Карпатый формулирует это кратко: «Можно отдать на аутсорс мышление, но нельзя — понимание». Вы делегируете исполнение, но решение о том, что строить и зачем, остаётся за вами.
Это ровно то, что я наблюдаю в работе с агентами. Агент — мощный исполнитель. Но без внятной спецификации и человеческого надзора он будет генерировать красивый мусор.
Три вещи, которые из этого стоит забрать прямо сейчас
Из всего, что говорит Карпатый, я бы выделил три практических вывода:
Учитесь управлять агентами. Навык промптинга и оркестрации агентов уже ценнее, чем знание конкретного языка программирования. Это справедливо для разработчиков, но ещё больше — для предпринимателей и руководителей.
Разделяйте прототипирование и продакшен. Вайб-кодинг снижает порог входа, но для серьёзных задач нужна инженерная дисциплина. Собрать прототип за вечер — здорово. Запустить надёжную систему для бизнеса — совсем другая история.
Инвестируйте в понимание. Конкретные инструменты устаревают быстро. Понимание принципов — нет. Тот, кто разобрался, как работают LLM и агенты на уровне концепций, легко освоит любой новый инструмент через полгода.
Карпатый описывает модели как «призраки, вызванные из статистических симуляций». Они работают в рамках тех контуров, которые были заложены данными и обучением. Ваша задача — понимать, в каком контуре вы находитесь в данный момент, и использовать это знание осознанно.
По теме
- Статья: Как я перестал бояться технической сложности, когда рядом появился агент
- Блог: OpenAI выпустили GPT-Realtime-2 — голосовые агенты научились думать во время разговора
- База знаний: Obsidian + Claude + n8n — база знаний, которая умнеет каждый день
Если вы уже работаете с ИИ-агентами или только присматриваетесь к тому, как встроить их в свои процессы, — разобраться в этих концепциях полезно до того, как начнёте строить.
Если захотите обсудить, как это применить у себя или в команде — пишите в Telegram @pimenov