SotaOCR — OCR-сервис за 25 копеек за страницу, который понимает таблицы, формулы и 100+ языков

SotaOCR — новый OCR-сервис для AI-агентов и LLM-пайплайнов: распознаёт PDF в структурированные данные с таблицами, формулами LaTeX и точными координатами элементов.

ИнструментыИИ-агенты

SotaOCR — свежий OCR-сервис, который сделал российский разработчик Глеб Кудрявцев. Подробно сам Глеб рассказывает про проект в своём Telegram-канале.

Если вы когда-нибудь пытались скормить PDF в LLM и получить оттуда что-то вменяемое — вы знаете, какая это боль. Таблицы рассыпаются, формулы превращаются в кашу, а бонусом прилетают галлюцинации про несуществующие ячейки. SotaOCR обещает решить именно эту задачу: превратить PDF в чистый структурированный JSON за копейки.

Что умеет

Под капотом — специализированная OCR-модель, заточенная под три вещи, которые обычно ломают стандартные решения:

  • Таблицы — в том числе со сложной структурой и объединёнными ячейками. На выходе — корректный Markdown.
  • Математические формулы — модель натренирована на LaTeX, так что интегралы и суммы не превратятся в абракадабру.
  • Точные координаты элементов (bounding boxes) — каждый распознанный блок получает честные границы. LLM-ки, для сравнения, рисуют координаты «как бог на душу положит».

Плюс поддержка более 100 языков, включая русский. По собственным бенчмаркам сервис заявляет 95% точности против 82% у Google Vision и 79% у Azure OCR. Цифры авторские, но направление понятное.

Зачем это ИИ-агентам

Главная фишка SotaOCR — он изначально спроектирован как инструмент для LLM-пайплайнов, а не как очередной «загрузите скан и получите текст». Есть REST API, SDK, и — что интереснее — готовые MCP-интеграции для Claude, Codex и Cursor. Ваш ИИ-агент может вызвать распознавание документа как обычный tool call, получить структурированный результат и работать дальше.

Цена — 25 копеек за страницу. Для сравнения: Google берёт $0.015, Azure — $0.01. При больших объёмах разница ощутимая.

Пара нюансов, прежде чем бросаться пробовать

Ограничения тоже есть. Рукописный текст распознаётся плохо — авторы говорят, что знают как усилить, но пока не сделали. Картинки временно отключены: работает только PDF. Сервис молодой, так что шероховатости возможны.

Для старта дают 30 бесплатных страниц — достаточно, чтобы погонять на реальных документах и понять, подходит ли качество под ваши задачи.

По теме

Если вы строите пайплайн обработки документов и ищете альтернативу Google Vision или Azure для своих AI-агентов — попробуйте SotaOCR на реальных данных и сравните результат.