База знаний

Yandex SpeechSense — ИИ-аналитика диалогов в контакт-центрах

Облачный сервис Yandex Cloud для глубокой аналитики звонков и чатов: распознавание речи, смысловые теги, отчёты, API и ассистенты на YandexGPT.

Опубликовано

Что это

Yandex SpeechSense — облачный сервис Yandex Cloud для глубокой аналитики голосовых и текстовых коммуникаций. Построен на стеке SpeechKit (распознавание и синтез речи), YandexGPT Pro (смысловой анализ) и Yandex Translate. Основная задача — превратить сырые записи звонков и чаты поддержки в структурированные данные: оценки качества, тематические срезы, отчёты для руководителей.

Официальная страница: cloud.yandex.ru/services/speechsense


Основные возможности

ВозможностьКак работает
Распознавание речиАвтоматическая транскрибация аудио через SpeechKit — двухканальные записи с разделением оператора и клиента
Смысловые тегиКонструктор тегов на основе YandexGPT — определяет темы, намерения, жалобы и ключевые события в диалоге
Словарные тегиПоиск по ключевым словам и фразам — точное срабатывание на конкретные формулировки
Поиск по диалогамПолнотекстовый и смысловой поиск — находит диалоги по контексту, а не только по точным словам
Отчёты и дашбордыВизуальные отчёты по тегам, операторам, периодам — без выгрузки в Excel
Анализ чатовРаботает не только с аудио, но и с текстовыми диалогами из мессенджеров и онлайн-чатов
ИИ-ассистентыНастраиваемые агенты на YandexGPT Pro, Lite, Qwen3 235B или DeepSeek V3.2 — автоматическое резюме диалога, оценка качества, извлечение фактов
Офлайн-аналитикаАудиобейджи (Badges) — загрузка аудио с носимых устройств для анализа офлайн-встреч
APIgRPC и REST API для загрузки диалогов, управления проектами и выгрузки результатов

Чем отличается от обычной речевой аналитики

SpeechSenseКлассические решения
Анализ смыслаYandexGPT понимает контекст и намерениеПоиск по ключевым словам
КаналыГолос + текст в одном интерфейсеОбычно только голос
НастройкаКонструктор тегов без кодаПравила пишут разработчики
МоделиВыбор из YandexGPT Pro/Lite, Qwen3, DeepSeekФиксированная модель
РазмещениеОблако Yandex Cloud или on-premisesЧаще только облако

Интеграция и подключение

Начало работы

  1. Создайте аккаунт в Yandex Cloud и активируйте сервис SpeechSense
  2. Создайте пространство (Space) и проект внутри него
  3. Настройте подключение — аудио или текст
  4. Загрузите диалоги через интерфейс или API

Авторизация API

SpeechSense использует стандартную авторизацию Yandex Cloud:

  • IAM-токен — для запросов от имени пользователя
  • API-ключ — для сервисных аккаунтов (рекомендуется для автоматизации)

Все запросы идут через gRPC или REST. Документация: cloud.yandex.ru/docs/speechsense

Форматы данных

  • Аудио: WAV, OggOpus — двухканальные файлы (отдельные дорожки оператора и клиента). Одноканальные конвертируются автоматически
  • Текст: JSON с массивом сообщений — каждое сообщение содержит автора, текст и таймстемп

On-premises

Для компаний с жёсткими требованиями к хранению данных доступна установка на собственной инфраструктуре. Развёртывание — через менеджера Yandex Cloud.


Тарифы и лимиты

Аудиодиалоги

Тарификация — за минуту двухканального аудио. Цена складывается из распознавания и аналитики.

Минут в месяцРаспознаваниеАналитикаИтого за минуту
до 100 0000,61 ₽1,40 ₽2,00 ₽
100 001 – 500 0000,37 ₽1,03 ₽1,40 ₽
500 001 – 1 000 0000,30 ₽0,61 ₽0,91 ₽
1 000 001 – 2 500 0000,30 ₽0,43 ₽0,73 ₽
от 2 500 0010,30 ₽0,30 ₽0,61 ₽

Текстовые диалоги

Тарификация — за 1 000 символов.

Тысяч символов в месяцЦена за 1 000 символов
до 100 0001,40 ₽
100 001 – 500 0001,04 ₽
500 001 – 1 000 0000,61 ₽
1 000 001 – 2 500 0000,43 ₽
от 2 500 0010,31 ₽

ИИ-ассистенты (дополнительно)

МодельЦена за 1 000 символов
YandexGPT Lite0,025 ₽
YandexGPT Pro0,15 ₽
Qwen3 235B0,31 ₽
DeepSeek V3.20,31 ₽

Автоматический пересчёт словарных и смысловых тегов — бесплатно. Цены указаны с НДС, актуальны на май 2026.

Квоты

  • До 100 проектов на одно пространство
  • До 1 000 тегов на проект

Практические сценарии

Контроль качества в контакт-центре

Самый прямой сценарий. SpeechSense автоматически проверяет, следует ли оператор скрипту, использует ли обязательные фразы, не грубит ли. Руководитель видит дашборд, а не слушает записи вручную.

Выявление повторяющихся проблем

Смысловые теги группируют диалоги по темам: «задержка доставки», «ошибка в счёте», «возврат товара». Вместо точечных жалоб — системная картина: какие проблемы растут, какие уходят.

Обучение новых операторов

Поиск по диалогам позволяет собрать библиотеку эталонных и провальных разговоров. Новичок слушает лучшие примеры, а не учится на собственных ошибках.

Аналитика продаж

Теги фиксируют, где клиент проявил интерес, где оператор предложил допродажу, где сделка сорвалась. Отдел продаж получает данные для точечных улучшений скриптов.

Анализ офлайн-встреч

Аудиобейджи записывают переговоры, консультации, приёмы — и загружают в SpeechSense для анализа. Полезно в банках, клиниках, автосалонах.

Мультиканальная поддержка

Один интерфейс для звонков и чатов. Можно сравнивать качество обслуживания по каналам и находить узкие места.


Ссылки


По теме

SpeechSense — пример того, как облачный ИИ-стек превращает неструктурированные данные (звонки, чаты) в управленческие решения. Если вас интересует тема практического внедрения ИИ — вот ещё три материала.

Если захотите обсудить, как это применить у себя или в команде — пишите в Telegram @pimenov