База знаний

Agent-ready сайт — методология подготовки сайта для работы с ИИ-агентами

Методология, которая превращает сайт из витрины для людей в среду, понятную ИИ-агентам: предсказуемые URL, машиночитаемые слои, граф связей, правила доступа и редакторский контроль.

Опубликовано

Методология, которая отвечает на вопрос: как сделать сайт понятным не только людям, но и ИИ-агентам? Не через чат-виджет или кнопку «спросить ИИ», а через архитектуру контента, машиночитаемые слои и редакторский порядок.

📖
Если вы ещё не задумывались, зачем сайту быть понятным агентам — начните со статьи Что значит «agent-ready» на практике. Здесь — пошаговое руководство по внедрению.

Что такое agent-ready сайт

Agent-ready сайт — это сайт, внутренняя структура которого позволяет ИИ-агенту читать, понимать, навигировать и действовать без постоянного угадывания.

Агент — не человек. Он не считывает интонацию, не догадывается по контексту и не чувствует визуальную иерархию. Ему нужны:

  • Предсказуемые маршруты — стабильные URL, понятная структура разделов
  • Чистые данные — текст, доступный без рендеринга сложных компонентов
  • Явные связи — внутренние ссылки, теги, graph tags, блоки «По теме»
  • Машиночитаемые слоиllms.txt, agent-description.md, schema markup, search index
  • Правила доступа — что можно читать, что предлагать, что менять
  • Редакторский контроль — человек решает, агент помогает

Agent-ready — это не отдельная оптимизация для машин. Это нормальная архитектура знания. Агенты просто быстро показывают, где в этой архитектуре дыры.


Какую проблему решает

Пока сайт — это десять страниц и лендинг, проблемы нет. Но когда появляется корпус контента (статьи, блог, база знаний, услуги, кейсы), возникают вопросы:

  • Агент может прочитать страницу, но не понимает её роль в системе
  • Агент не знает, какие материалы связаны между собой
  • Агент не различает черновик и опубликованный материал
  • Агент не видит, куда ведёт маршрут от статьи к услуге
  • Агент не знает, где источник правды — в CMS, в коде или на сайте

Без agent-ready архитектуры агент работает как человек в архиве без каталогов: что-то найдёт, что-то перепутает, что-то додумает.


Семь слоёв agent-ready сайта

Методология выделяет семь слоёв, каждый из которых делает сайт более понятным для агентов.

СлойЧто даётПримеры реализации
1. Предсказуемые URLАгент может строить ссылки, проверять существование страниц и навигировать без парсинга меню/articles/slug/, /knowledge/slug/, /services/slug/ — стабильная иерархия без случайных ID
2. Доступный текстАгент читает контент без рендеринга JavaScript-компонентов и без обхода paywallСемантический HTML, markdown-представления, search index в JSON, RSS-фиды
3. Явные связиАгент понимает не только страницу, но и её место в системеВнутренние ссылки, блоки «По теме», теги, graph tags, relation-свойства в CMS
4. Машиночитаемые слоиАгент получает метаинформацию о сайте в удобном форматеllms.txt, agent-description.md, /.well-known/, JSON-LD schema markup, sitemap, OpenGraph
5. Контентный графАгент видит кластеры, пробелы, маршруты и может предлагать редакционные действияSVG-карта графа, semantic snapshot через TF-IDF, Graph Opportunities Console
6. Правила доступаАгент знает, где можно только читать, где предлагать, где создавать черновикAGENTS.md, permissions в CMS, read-only API vs read-write API, approval gates
7. Редакторский контрольЧеловек сохраняет финальное решение, агент не публикует без проверкиСтатусы (черновик → на проверке → опубликовано), checkpoint-ы, handoff-протоколы

Слой 1: Предсказуемые URL

Стабильные, человекочитаемые URL — фундамент agent-ready сайта.

Правила:

  • Каждый тип контента живёт в своём разделе: /articles/, /blog/, /knowledge/, /services/, /cases/
  • URL строится из slug, а не из ID базы данных
  • URL не меняется после публикации — редиректы при необходимости
  • Нет дублирующих путей к одному материалу

Что это даёт агенту:

  • Может предсказать URL по типу и slug без обращения к API
  • Может проверить ссылку на существование
  • Может строить кросс-ссылки между материалами
✅ pimenov.ai/knowledge/mcp-model-context-protocol-spravochnik/
✅ pimenov.ai/articles/chto-znachit-agent-ready-na-praktike/
❌ pimenov.ai/page/3f7a2b1c-e8c9-4015-82cf-e17b935a7b93
❌ pimenov.ai/?p=142

Слой 2: Доступный текст

Агент не умеет кликать по аккордеонам, скроллить бесконечные ленты и ждать загрузки React-компонентов. Ему нужен текст.

Чеклист:

Весь важный контент доступен в HTML без JavaScript
Есть search index в формате JSON (для полнотекстового поиска)
Есть RSS/Atom-фиды для блога и статей
Заголовки, списки, таблицы используют семантические HTML-теги
Изображения имеют alt-тексты
Контент не спрятан за интерактивными компонентами

Продвинутый уровень:

  • Markdown-представления страниц (генерируемые при сборке)
  • Agent-friendly версии документации
  • Structured data (JSON-LD) для ключевых типов контента

Слой 3: Явные связи

Теги отвечают на вопрос «о чём». Связи отвечают на вопрос «зачем» и «куда ведёт».

Типы связей

ТипКак работаетПример
Внутренние ссылкиЯвная связь между двумя материалами, поставленная авторомВ статье про MCP — ссылка на справочник по MCP в базе знаний
Блок «По теме»Курированные связи в конце каждого материала: статья + блог + база знанийТри ссылки разных типов, помогающие читателю (и агенту) двигаться по системе
ТегиТематическая классификацияИИ-агенты, DevTools, Методология
Graph TagsСемантические метки, описывающие роль материала в системеContent pipeline, Agent orchestration, Knowledge system
Relation-свойства в CMSЯвные связи между записями в базе данныхСвязь «Статья → Услуга», «Справочник → Статья»

Зачем агенту: он видит не отдельную страницу, а её место в системе — к какому кластеру относится, куда ведёт маршрут, какие материалы поддерживают этот.


Слой 4: Машиночитаемые слои

Это файлы и эндпоинты, которые агент может прочитать, чтобы понять сайт как целое — до того, как начнёт читать отдельные страницы.

llms.txt

Файл в корне сайта, описывающий его для языковых моделей. Формат — Markdown.

# pimenov.ai

> Персональный сайт Сергея Пименова.
> Статьи, блог, база знаний, кейсы и услуги
> в области практического ИИ и агентных систем.

## Разделы
- /articles/ — авторские статьи
- /blog/ — короткие заметки и наблюдения
- /knowledge/ — база знаний: руководства по инструментам и методологиям
- /services/ — описание услуг
- /cases/ — реализованные проекты
- /graph/ — интерактивный контентный граф

agent-description.md

Более детальное описание сайта для агентов, размещённое в /.well-known/agent-description.md. Включает:

  • Что это за сайт
  • Какие типы контента есть
  • Какие данные доступны
  • Что можно, а что нельзя
  • Где источник правды

Другие машиночитаемые слои

Файл / слойНазначение
/sitemap.xmlПолный список URL с датами обновления. Агенту помогает обнаружить все страницы
/search-index.jsonПолнотекстовый индекс для поиска без API. Агент может искать локально
/robots.txtПравила доступа для ботов. Отдельные user-agent для ИИ-краулеров
JSON-LD schema markupСтруктурированные данные на страницах: Article, FAQPage, HowTo, Organization
OpenGraph / Twitter CardsМетаданные для предпросмотра, которые агенты тоже парсят
RSS / AtomХронологические фиды для отслеживания обновлений

Слой 5: Контентный граф

Когда у сайта есть граф связей, агент перестаёт работать с отдельными страницами и начинает видеть систему.

Что граф даёт агенту:

  • Пробелы — темы, которые упоминаются, но не раскрыты → агент может предложить новый материал
  • Мосты — кластеры, связанные по смыслу, но не ссылающиеся друг на друга → агент может предложить кросс-ссылки
  • Сироты — материалы без входящих и исходящих связей → агент может встроить их в систему
  • Маршруты — цепочки от контента к действию (услуге) → агент может укрепить слабые звенья
  • Обновления — сильные узлы с устаревшей информацией → агент может подсветить необходимость ревизии

Подробнее о методологии контентного графа: Контентный граф — методология управления контентом через связи, а не рубрики


Слой 6: Правила доступа

Агент без правил — генератор хаоса. Agent-ready сайт чётко определяет, что агент может и чего не может.

Матрица доступа

ЗонаЧтениеПредложениеСоздание черновикаПубликация
Публичный сайт
Редакционная CMS❌ (только человек)
Производственный слой (Directus)✅ (read-only API)
Код / репозиторий✅ (PR)✅ (ветка)❌ (merge — человек)

AGENTS.md как конституция проекта

Файл AGENTS.md в корне репозитория описывает:

  • Структуру проекта
  • Границы ответственности агента
  • Запрещённые действия
  • Порядок работы с файлами и данными
  • Формат checkpoint-ов и handoff-ов

Это не документация для людей — это инструкция для агента, определяющая его поведение в конкретном проекте.


Слой 7: Редакторский контроль

Agent-ready не означает agent-managed. Человек сохраняет право решения на каждом этапе.

Принципы:

  1. Агент создаёт черновик — человек проверяет и публикует
  2. Агент предлагает связи — человек решает, какие оставить
  3. Агент подсвечивает пробелы — человек решает, закрывать ли их
  4. Агент не удаляет и не перезаписывает опубликованный контент без явного одобрения

Механизмы контроля:

  • Статусы в CMS: ЧерновикНа проверкеОпубликовано
  • Checkpoint-ы: фиксация состояния после каждого сеанса работы
  • Handoff-протоколы: передача контекста между агентами и людьми
  • Approval gates: точки, где требуется явное одобрение человека
graph LR
    A["Граф показывает сигнал"] --> B["Консоль формулирует бриф"]
    B --> C["Агент пишет черновик"]
    C --> D["Человек проверяет"]
    D --> E["Публикация"]
    E --> F["Граф пересобирается"]
    F --> A

Как применять пошагово

Шаг 1: Навести порядок в URL

Перевести все страницы на предсказуемую slug-структуру. Настроить редиректы со старых URL. Убрать дубли.

Шаг 2: Сделать контент доступным

Проверить, что весь важный текст доступен без JavaScript. Добавить search index, RSS, alt-тексты к изображениям.

Шаг 3: Выстроить связи

Добавить блоки «По теме» к каждому материалу. Проверить внутренние ссылки. Ввести graph tags, если материалов больше 50.

Шаг 4: Добавить машиночитаемые слои

Создать llms.txt и agent-description.md. Добавить JSON-LD schema markup. Проверить sitemap и robots.txt.

Шаг 5: Построить граф

Извлечь все внутренние ссылки. Построить semantic snapshot. Визуализировать граф. Начать читать сигналы: пробелы, мосты, сироты.

Шаг 6: Определить правила

Написать AGENTS.md для репозитория. Настроить permissions в CMS. Разделить read-only и read-write доступ.

Шаг 7: Замкнуть контур

Настроить редакторский процесс: агент создаёт черновик → человек проверяет → публикация → граф обновляется → новые сигналы.


Когда agent-ready нужен и когда избыточен

СитуацияНужен?Почему
Лендинг или одностраничникНетНечего индексировать, нет корпуса контента
Сайт с 10–20 страницамиЧастичноДостаточно слоёв 1–2 (URL + доступный текст)
Контентный сайт с 50+ материаламиДаГраф, связи и правила начинают окупаться
Сайт с ИИ-агентами в редакционном процессеОбязательноБез правил и структуры агент создаёт хаос, а не контент
SaaS-документацияДаАгенты — основные читатели документации (Cloudflare, Vercel, Stripe уже оптимизируют)
E-commerceДаАгенты сканируют спеки, цены, наличие, FAQ — structured data критичен

Agent-ready = human-ready

Самое важное наблюдение: всё, что делает сайт понятным агенту, делает его понятнее человеку.

  • Предсказуемые URL → удобная навигация для читателя
  • Доступный текст → лучшая индексация поисковиками
  • Явные связи → читатель легче двигается по сайту
  • Контентный граф → редактор видит, чего не хватает
  • Правила доступа → меньше ошибок в процессе
  • Редакторский контроль → выше качество публикаций

Agent-ready — это не отдельная оптимизация для машин. Это зрелая архитектура контента, которую агенты просто делают видимой.


Инструменты проверки

ИнструментЧто проверяет
isitagentready.com (Cloudflare)Agent Readiness Score: наличие llms.txt, agent-description, schema markup, robots.txt с правилами для ИИ-краулеров
Google Rich Results TestВалидность JSON-LD structured data
Lighthouse AccessibilityAccessibility tree — то, что видит агент вместо визуального интерфейса
GraphifyАвтоматическое построение контентного графа из папки с файлами
MCP InspectorТестирование MCP-серверов, если сайт предоставляет MCP-эндпоинт

Новые стандарты (2025–2026)

Экосистема agent-ready развивается быстро. Ключевые направления:

  • llms.txt — де-факто стандарт описания сайта для языковых моделей
  • WebMCP — предложенный браузерный API от Google Chrome, позволяющий сайтам предоставлять свои функции как structured tools для агентов
  • NLWeb (Microsoft) — протокол для natural language запросов к сайтам
  • Agent Readiness Score (Cloudflare) — метрика, показывающая, насколько сайт готов к работе с агентами
  • MCP (Model Context Protocol) — стандарт подключения ИИ к внешним системам, включая сайты через remote MCP-серверы

Ссылки


По теме

Если вы хотите сделать свой сайт понятным не только людям, но и ИИ-агентам — можно разобрать архитектуру вместе. Пишите в Telegram @pimenov