Независимый поисковый API с собственным индексом 30+ млрд страниц. Быстрый и надёжный веб-поиск для AI-агентов, RAG-систем и чат-ботов — без зависимости от Google или Bing.
SotaOCR — OCR-сервис за 25 копеек за страницу, который понимает таблицы, формулы и 100+ языков
SotaOCR — новый OCR-сервис для AI-агентов и LLM-пайплайнов: распознаёт PDF в структурированные данные с таблицами, формулами LaTeX и точными координатами элементов.
SotaOCR — свежий OCR-сервис, который сделал российский разработчик Глеб Кудрявцев. Подробно сам Глеб рассказывает про проект в своём Telegram-канале.
Если вы когда-нибудь пытались скормить PDF в LLM и получить оттуда что-то вменяемое — вы знаете, какая это боль. Таблицы рассыпаются, формулы превращаются в кашу, а бонусом прилетают галлюцинации про несуществующие ячейки. SotaOCR обещает решить именно эту задачу: превратить PDF в чистый структурированный JSON за копейки.
Что умеет
Под капотом — специализированная OCR-модель, заточенная под три вещи, которые обычно ломают стандартные решения:
- Таблицы — в том числе со сложной структурой и объединёнными ячейками. На выходе — корректный Markdown.
- Математические формулы — модель натренирована на LaTeX, так что интегралы и суммы не превратятся в абракадабру.
- Точные координаты элементов (bounding boxes) — каждый распознанный блок получает честные границы. LLM-ки, для сравнения, рисуют координаты «как бог на душу положит».
Плюс поддержка более 100 языков, включая русский. По собственным бенчмаркам сервис заявляет 95% точности против 82% у Google Vision и 79% у Azure OCR. Цифры авторские, но направление понятное.
Зачем это ИИ-агентам
Главная фишка SotaOCR — он изначально спроектирован как инструмент для LLM-пайплайнов, а не как очередной «загрузите скан и получите текст». Есть REST API, SDK, и — что интереснее — готовые MCP-интеграции для Claude, Codex и Cursor. Ваш ИИ-агент может вызвать распознавание документа как обычный tool call, получить структурированный результат и работать дальше.
Цена — 25 копеек за страницу. Для сравнения: Google берёт $0.015, Azure — $0.01. При больших объёмах разница ощутимая.
Пара нюансов, прежде чем бросаться пробовать
Ограничения тоже есть. Рукописный текст распознаётся плохо — авторы говорят, что знают как усилить, но пока не сделали. Картинки временно отключены: работает только PDF. Сервис молодой, так что шероховатости возможны.
Для старта дают 30 бесплатных страниц — достаточно, чтобы погонять на реальных документах и понять, подходит ли качество под ваши задачи.
По теме
Если вы строите пайплайн обработки документов и ищете альтернативу Google Vision или Azure для своих AI-агентов — попробуйте SotaOCR на реальных данных и сравните результат.
Если хотите разобрать свою задачу — напишите мне Если хотите разобрать свою задачу — напишите мне.
Можно прийти с идеей, черновым контекстом или уже живой задачей. Помогу быстро понять, где реальный следующий шаг, а где лишний шум.
Обычно хватает 2–3 сообщений, чтобы понять, могу ли я здесь реально помочь и в каком формате лучше двигаться дальше.
Связанные материалы
Закрыли весь аудиослой pimenov.ai: 365 аудиоматериалов, 21 час 25 минут звука и около 933 ₽ за всю генерацию через Яндекс SpeechKit.
История о том, как два внешних сигнала — замечание после консультации и комментарий в Facebook — сначала заставили меня сделать поиск по pimenov.ai, а потом привели к появлению гра…