Независимый поисковый API с собственным индексом 30+ млрд страниц. Быстрый и надёжный веб-поиск для AI-агентов, RAG-систем и чат-ботов — без зависимости от Google или Bing.
SotaOCR — OCR-сервис за 25 копеек за страницу, который понимает таблицы, формулы и 100+ языков
SotaOCR — новый OCR-сервис для AI-агентов и LLM-пайплайнов: распознаёт PDF в структурированные данные с таблицами, формулами LaTeX и точными координатами элементов.
SotaOCR — свежий OCR-сервис, который сделал российский разработчик Глеб Кудрявцев. Подробно сам Глеб рассказывает про проект в своём Telegram-канале.
Если вы когда-нибудь пытались скормить PDF в LLM и получить оттуда что-то вменяемое — вы знаете, какая это боль. Таблицы рассыпаются, формулы превращаются в кашу, а бонусом прилетают галлюцинации про несуществующие ячейки. SotaOCR обещает решить именно эту задачу: превратить PDF в чистый структурированный JSON за копейки.
Что умеет
Под капотом — специализированная OCR-модель, заточенная под три вещи, которые обычно ломают стандартные решения:
- Таблицы — в том числе со сложной структурой и объединёнными ячейками. На выходе — корректный Markdown.
- Математические формулы — модель натренирована на LaTeX, так что интегралы и суммы не превратятся в абракадабру.
- Точные координаты элементов (bounding boxes) — каждый распознанный блок получает честные границы. LLM-ки, для сравнения, рисуют координаты «как бог на душу положит».
Плюс поддержка более 100 языков, включая русский. По собственным бенчмаркам сервис заявляет 95% точности против 82% у Google Vision и 79% у Azure OCR. Цифры авторские, но направление понятное.
Зачем это ИИ-агентам
Главная фишка SotaOCR — он изначально спроектирован как инструмент для LLM-пайплайнов, а не как очередной «загрузите скан и получите текст». Есть REST API, SDK, и — что интереснее — готовые MCP-интеграции для Claude, Codex и Cursor. Ваш ИИ-агент может вызвать распознавание документа как обычный tool call, получить структурированный результат и работать дальше.
Цена — 25 копеек за страницу. Для сравнения: Google берёт $0.015, Azure — $0.01. При больших объёмах разница ощутимая.
Пара нюансов, прежде чем бросаться пробовать
Ограничения тоже есть. Рукописный текст распознаётся плохо — авторы говорят, что знают как усилить, но пока не сделали. Картинки временно отключены: работает только PDF. Сервис молодой, так что шероховатости возможны.
Для старта дают 30 бесплатных страниц — достаточно, чтобы погонять на реальных документах и понять, подходит ли качество под ваши задачи.
По теме
- Статья: Карпати перестал кодить и начал «компилировать знания» — разбираю его систему LLM Knowledge Bases
- Блог: Gemini Embedding 2 вышел — и мультимодальный поиск стал на шаг ближе к продакшену
- База знаний: EmbeddingGemma (Gemma 3) — компактная embedding-модель от Google для on-device RAG
Если вы строите пайплайн обработки документов и ищете альтернативу Google Vision или Azure для своих AI-агентов — попробуйте SotaOCR на реальных данных и сравните результат.