Cloudflare Agents SDK — фреймворк для stateful AI-агентов поверх Durable Objects: каждый агент — отдельный «микросервер» с SQLite, WebSocket, планировщиком и hibernation. Разбираем…
Open WebUI — открытая платформа, которая разворачивается на вашем сервере и даёт единый интерфейс для работы с любыми языковыми моделями: локальными через Ollama и облачными через OpenAI-совместимые API. По сути, это ваш собственный ChatGPT, где данные остаются у вас.
Что это такое
Open WebUI — это self-hosted веб-интерфейс для больших языковых моделей. Вы поднимаете его на своём железе или в облаке, подключаете нужные модели и получаете знакомый чат, но с полным контролем над данными и настройками.
Ключевая идея — provider-agnostic: интерфейс не привязан к одному поставщику моделей. Можно подключить локальную модель через Ollama, облачные OpenAI и Anthropic, любой OpenAI-совместимый сервис — и переключаться между ними прямо в разговоре.
Работает полностью офлайн: по умолчанию платформа не делает внешних запросов и подходит даже для изолированных (air-gapped) сетей.
Краткая история проекта
- 2023 — старт как Ollama WebUI. Проект создал Тим Чжэрян Бэк (Tim Jaeryang Baek, на GitHub — tjbck) как удобную веб-оболочку для локального движка Ollama.
- Переименование в Open WebUI. Когда добавилась поддержка OpenAI-совместимых API, проект перерос привязку к Ollama и получил нейтральное название — интерфейс стал универсальным для любых моделей.
- Рост в одну из крупнейших open-source ИИ-площадок. Сегодня это 140+ тысяч звёзд на GitHub, десятки миллионов загрузок Docker-образа и комьюнити в сотни тысяч участников. Проект поддержан Mozilla Builders.
- Эволюция лицензии. Сначала MIT, в январе 2025 — переход на пермиссивную BSD 3-Clause, а с версии 0.6.6 (апрель 2025) — собственная Open WebUI License с оговоркой о защите брендинга.
- Появление компании. Вокруг проекта выросла Open WebUI Inc. с корпоративным предложением (SSO, кастомный брендинг, SLA, долгосрочная поддержка). При этом ядро остаётся открытым и бесплатным.
Основные возможности
| Область | Что умеет |
| Чат с моделями | Любой провайдер в одном окне, переключение модели по ходу разговора, сравнение двух моделей бок о бок, веб-поиск с цитатами, запуск Python прямо в чате |
| Знания и RAG | Загрузка документов и базы знаний, поиск по ним (vector + гибридный), несколько движков извлечения текста, режим полного контекста без чанкинга |
| Модели и агенты | Пресеты модели: системный промпт + инструменты + база знаний + параметры в одном пакете. Так собираются специализированные ассистенты под задачу |
| Расширяемость | Python-инструменты и функции, пайплайны, нативная поддержка MCP, подключение OpenAPI-серверов, промпты-шаблоны со слэш-командами |
| Командная работа | Мультипользовательский режим, роли и группы (RBAC), общие каналы, где люди и модели в одной переписке |
| Мультимедиа | Голосовой ввод и озвучка, голосовые и видеозвонки, генерация изображений через DALL-E, Gemini, ComfyUI и AUTOMATIC1111 (два последних — локально); для движка OpenAI модель задаётся из открытого списка — DALL·E 2/3, GPT-Image-1 и новее, вплоть до gpt-image-2 |
| Администрирование | Аналитика расхода токенов и стоимости, оценка моделей (арена, A/B, ELO-рейтинг), вебхуки, системные баннеры |
Подключение и развёртывание
Open WebUI ставится несколькими способами — выбирайте под свою инфраструктуру.
Связка с Ollama (самый частый сценарий):
# Скачиваем локальную модель
ollama pull llama3
# Запускаем Open WebUI в Docker и подключаем к локальному Ollama
docker run -d -p 3000:8080 \
--add-host=host.docker.internal:host-gateway \
-v open-webui:/app/backend/data \
--name open-webui \
ghcr.io/open-webui/open-webui:mainПосле запуска интерфейс доступен на http://localhost:3000. Если Ollama работает на той же машине, Open WebUI находит модели автоматически — они сразу появляются в списке выбора.
Установка через pip (без Docker):
pip install open-webui
open-webui serveДля продакшена есть официальные Helm-чарты для Kubernetes, поддержка облачных хранилищ (S3, GCS, Azure Blob), Redis для сессий и горизонтального масштабирования, а также OpenTelemetry для наблюдаемости.
Тарифы и лимиты
- Ядро — бесплатное и открытое. Скачиваете, разворачиваете у себя, используете без оплаты. Лимиты упираются только в ваше железо: чем мощнее сервер и GPU, тем крупнее модели вы потянете локально.
- Облачные модели оплачиваются отдельно — по тарифам их провайдеров (OpenAI, Anthropic и т.д.). Open WebUI здесь только интерфейс.
- Enterprise-лицензия добавляет кастомный брендинг и логотип, SLA-поддержку, LTS-версии. Нужна организациям, которым важны эти возможности.
Enterprise-лицензия: условия и стоимость
Бесплатное открытое ядро закрывает большинство задач. Отдельная лицензия нужна по сути в одном случае — если вы меняете или убираете брендинг Open WebUI.
| Сценарий использования | Что требуется |
| Стандартное использование — внутри компании, брендинг Open WebUI остаётся как есть | Бесплатно |
| Enterprise-использование — white-label, ребрендинг, изменение или удаление брендинга | Нужна Enterprise-лицензия |
Что входит в Enterprise-лицензию:
- White-label и кастомный брендинг — тема, логотип и UX под вашу компанию
- SLA-поддержка с гарантированным временем ответа
- LTS-версии с долгосрочной поддержкой
- Выделенный менеджер аккаунта: онбординг, регулярные созвоны, стратегия
- Приоритетная обработка запросов на новые функции
Связка с Docling: качественное извлечение документов
Встроенный парсер документов в Open WebUI справляется с простыми файлами, но на сложных PDF с таблицами теряет структуру. Здесь выручает Docling — открытый инструмент IBM, который аккуратно превращает PDF, Word и презентации в чистый текст с сохранением таблиц и порядка чтения.
Open WebUI умеет использовать Docling как движок извлечения (content extraction engine): вы поднимаете Docling Serve, указываете его адрес в Admin Panel → Settings → Documents — и весь загружаемый контент идёт через Docling. Результат — заметно более точные ответы RAG.
Ограничения и на что обратить внимание
Open WebUI — зрелая платформа, но перед внедрением полезно учитывать несколько моментов:
- Железо под локальные модели. Сам интерфейс лёгкий, но локальные LLM требуют ресурсов: мелкие модели идут на CPU, крупные — только с GPU и достаточным объёмом VRAM.
- Лицензия и брендинг. Для white-label и SaaS-сценариев важна оговорка о брендинге — без enterprise-лицензии убирать логотип Open WebUI нельзя (кроме исключений выше).
- Частые релизы. Проект развивается быстро, изредка с ломающими изменениями. На проде стоит фиксировать версию образа или брать LTS.
- RAG требует настройки. Поиск по документам работает из коробки, но за качество отвечают выбор движка извлечения и embeddings — для сложных PDF и таблиц лучше подключить Docling.
Полезные варианты применения
Личный ИИ-ассистент. Своя ИИ-среда, где переписка и документы не уходят в чужое облако. Удобно, если вы много работаете с моделями и не хотите платить за каждый сервис отдельно.
Внутренний ИИ-портал для команды. Один вход для всей компании: роли, группы, ограничение доступа к моделям, SSO. Сотрудники работают с ИИ через единый интерфейс вместо зоопарка из разных подписок.
RAG по внутренним документам. Загружаете регламенты, базу знаний, договоры — и модель отвечает на их основе с ссылками на источники. Хороший способ сделать корпоративную справочную поверх собственных данных.
Хаб для нескольких провайдеров без вендор-лока. Подключаете локальные и облачные модели одновременно, сравниваете ответы бок о бок и выбираете оптимальную модель под задачу и бюджет.
Изолированный (офлайн) контур. Для чувствительных данных или сетей без интернета: всё крутится на своём железе, внешних запросов нет. Частый выбор там, где облако недопустимо по требованиям безопасности.
Сборка специализированных агентов. Через пресеты модели вы упаковываете системный промпт, нужные инструменты и базу знаний в готового ассистента — например, «ревьюер кода по нашим правилам» или «помощник по поддержке на основе нашей документации».
Расширение под свои процессы. Python-инструменты, пайплайны, MCP и OpenAPI позволяют подключить внешние сервисы и встроить ИИ в существующие рабочие контуры, а не наоборот.
Ссылки
- Официальный сайт: openwebui.com
- Документация: docs.openwebui.com
- Исходный код: github.com/open-webui/open-webui
По теме
Если вы присматриваетесь к собственной ИИ-среде для себя или команды и не хотите утонуть в настройке и выборе моделей, это как раз тот случай, где полезно разобрать детали под вашу задачу.
Если захотите обсудить, как это применить у себя или в команде — пишите в Telegram @pimenov
Если хотите разобрать свою задачу — напишите мне Если хотите разобрать свою задачу — напишите мне.
Можно прийти с идеей, черновым контекстом или уже живой задачей. Помогу быстро понять, где реальный следующий шаг, а где лишний шум.
Обычно хватает 2–3 сообщений, чтобы понять, могу ли я здесь реально помочь и в каком формате лучше двигаться дальше.
Связанные материалы
Открытый ИИ-агент от Nous Research: трёхуровневая память, самообучающиеся навыки, GEPA-оптимизация и 24/7 работа через Telegram.
Как устроена безопасность MCP: реальные атаки (tool poisoning, prompt injection, rug pull, tool shadowing) и практические меры: OAuth-авторизация, изоляция, least privilege, сканир…