pimenov.ai

База знаний

Голос вместо клавиатуры: 7 приложений для голосового ввода в 2026

Сравнение семи приложений для голосового ввода — Wispr Flow, Spokenly, Superwhisper, Aqua Voice, VoiceInk, Google Eloquent и Handy: цены, платформы и приватность.

Опубликовано

Голосовой ввод за последние два года перестал быть «диктофоном с распознаванием»: современные приложения превращают живую речь в чистый, отформатированный текст прямо в любом поле ввода. Ниже — разбор семи решений, которые я тестировал, и логика выбора под конкретные задачи.

🎙️
Я сам почти не печатаю вручную: весь рабочий поток держу на Wispr Flow и голосовом вводе внутри Codex First. Надиктовать постановку задачи агенту голосом, пока руки заняты другим, — для меня самый прогрессивный способ работать с инструментами сегодня. Уверен, что за голосовым интерфейсом к агентам ближайшее будущее.

Как выбрать за 30 секунд

  • Нужно максимально гладко и на всех устройствах → Wispr Flow.
  • Важна приватность и работа без облака → Spokenly, VoiceInk или Handy.
  • Диктуете в кодинг-агента (Codex, Cursor) → Spokenly (MCP) или Aqua Voice (технический словарь).
  • Хотите бесплатно и навсегда → Handy, Spokenly (локально) или Superwhisper (базовый тариф).
  • Только iPhone и офлайн → Google AI Edge Eloquent.

Wispr Flow — облачная диктовка для Mac, Windows и телефона

Облачное приложение для голосового ввода в любом поле: автоматически убирает слова-паразиты, расставляет пунктуацию, поддерживает команды и форматирование. Более 100 языков.

  • Платформы: macOS 11+, Windows 10+, iPhone (iOS 18.3+), Android 13+.
  • Цена: бесплатно — 2000 слов в неделю на десктопе (Mac и Windows суммарно) плюс отдельно 1000 слов в неделю на iOS, на Android пока без лимита (ограниченное предложение). Pro — $15/мес помесячно или $12/мес при годовой оплате.
  • Сильные стороны: самый гладкий результат «из коробки», одинаково работает на всех платформах, аккуратная пунктуация.
  • Слабые стороны: транскрипция всегда идёт через облако — полностью офлайн не выйдет; на десктопе нет безлимита.
  • Кому подойдёт: тем, кому нужен один инструмент на всех устройствах и кто не против облака.

Spokenly — локальные и облачные модели с режимом для агентов

Голосовой ввод с выбором между локальными моделями (Whisper, Parakeet) и облачными по вашему API-ключу. Есть MCP-сервер для кодинг-агентов и Agent Mode для голосового управления macOS.

  • Платформы: macOS, iOS, Windows; одна подписка покрывает все.
  • Цена: бесплатно — безлимитная локальная диктовка и облако по своему ключу (BYOK) за $0; Pro — $9.99/мес (встроенные облачные модели без своего ключа и дополнительные функции).
  • Сильные стороны: бесплатный безлимит на локальных моделях, приватность, прямая связка с Claude Code и Cursor через MCP, 100+ языков.
  • Слабые стороны: «беспроблемное» облако без своего ключа — только в Pro; интерфейс плотнее, чем у Wispr.
  • Кому подойдёт: тем, кто диктует в кодинг-агентов и ценит локальную обработку.

Superwhisper — диктовка и расшифровка встреч в одном приложении

Голосовой ввод в любое приложение плюс запись и расшифровка встреч. Кастомные режимы и промпты, словарь, локальные и облачные модели.

  • Платформы: macOS, Windows, iOS (Linux нет).
  • Цена: бесплатный тариф — голосовой ввод в любых приложениях, запись встреч, 100+ языков, небольшие локальные модели и кастомный промпт; Pro — $8.49/мес, $84.99/год (≈$7.08/мес) или $249.99 разово (lifetime). Студентам скидка 40%.
  • Сильные стороны: гибкие режимы под задачу (письмо, код, заметки), пожизненная лицензия, запись встреч.
  • Слабые стороны: крупные локальные и облачные модели, разделение спикеров и словарь — только в Pro.
  • Кому подойдёт: тем, кому нужен один инструмент и для диктовки, и для встреч, и кто готов один раз заплатить.

Aqua Voice — облачная модель с упором на точность и термины

Облачный голосовой ввод на собственной модели Avalon, заточенной под точность и технический лексикон.

  • Платформы: macOS, Windows, iPhone.
  • Цена: бесплатный Starter — 1000 слов суммарно (разово, не в месяц), движок Aqua и 5 слов в словаре; Pro — $8/мес при годовой оплате ($96/год), модель Avalon, словарь на 800 слов, безлимит; Team — $12/мес при годовой оплате.
  • Сильные стороны: Avalon — лучшая на октябрь 2025 проприетарная модель в Open ASR Leaderboard, отлично распознаёт код и термины.
  • Слабые стороны: только облако, офлайна нет ни на одном тарифе; 49 языков против 100+ у конкурентов; бесплатно — лишь 1000 слов на всё время.
  • Кому подойдёт: тем, кому важна точность на терминах и коде и кто работает онлайн.

VoiceInk — локальная диктовка для Mac с открытым кодом

Локальное приложение для голосового ввода с открытым кодом: обработка на устройстве, опциональное облачное улучшение по своему ключу.

  • Платформы: только macOS (Apple Silicon, macOS 14.4+).
  • Цена: разовая покупка — $25 (1 Mac), $39 (2) или $49 (3); сейчас действует скидка 50%.
  • Сильные стороны: полностью локально и приватно, открытый код (GPLv3, более 5000 звёзд на GitHub), оплата без подписки.
  • Слабые стороны: только Mac на Apple Silicon — нет версий для Windows, iOS и старых Intel-маков.
  • Кому подойдёт: пользователям Mac, которым нужна приватная локальная диктовка без подписки.

Google AI Edge Eloquent — бесплатный офлайн-ввод на iPhone

Бесплатное приложение Google с офлайн-распознаванием на встроенной модели Gemma: чистит слова-паразиты, полирует текст, ведёт личный словарь (можно импортировать из Gmail), есть опциональный гибридный режим с облачным Gemini.

  • Платформы: iPhone и iPad (есть и версия для Mac); запуск — около апреля 2026.
  • Цена: бесплатно.
  • Сильные стороны: работает офлайн на устройстве, бесплатно, аккуратная чистка текста.
  • Слабые стороны: первая версия ориентирована на английский и работает внутри приложения, а не системно во всех полях ввода.
  • Кому подойдёт: владельцам iPhone, кому нужен бесплатный офлайн-ввод и кто пишет в основном по-английски.

Handy — единственный в подборке с поддержкой Linux

Бесплатное приложение с открытым кодом для офлайн-диктовки: модели Whisper и Parakeet, простая логика «нажал — продиктовал».

  • Платформы: macOS, Windows, Linux. Собрано на Tauri (Rust), автор — CJ Pais.
  • Цена: бесплатно, открытый код (MIT).
  • Сильные стороны: единственное решение в подборке с Linux, полностью офлайн, бесплатно и открыто.
  • Слабые стороны: слабее «причёсывает» текст и беднее по функциям, чем коммерческие аналоги.
  • Кому подойдёт: разработчикам и тем, кто работает в Linux и хочет простой бесплатный офлайн-ввод.

Сводная таблица

ПриложениеПлатформыЛокально/офлайнБесплатный тарифЦена Pro
Wispr FlowMac, Windows, iOS, AndroidНет (облако)2000 слов/нед десктоп + 1000/нед iOS$12–15/мес
SpokenlyMac, Windows, iOSДаЛокальный безлимит + BYOK$9.99/мес
SuperwhisperMac, Windows, iOSДаВвод + встречи, малые модели$8.49/мес или $249.99 разово
Aqua VoiceMac, Windows, iOSНет (облако)1000 слов разово$8/мес (год)
VoiceInkmacOS (Apple Silicon)ДаНет (платно, есть триал)$25 разово
Google EloquentiPhone, iPad, MacДаБесплатно полностью
HandyMac, Windows, LinuxДаБесплатно полностью

Голос + Codex First: как это работает у меня

Голос снимает трение между мыслью и постановкой задачи. На практике связка выглядит так:

  • Длинную постановку задачи агенту я надиктовываю через Wispr Flow — получается связный промпт без «затыков» клавиатуры, даже на ходу.
  • Для работы внутри кодинг-агента подключаю Spokenly: его MCP-сервер позволяет принимать голос прямо в Codex или Cursor.
  • Короткие правки и сообщения Notion-агенту — тоже голосом.

Итог: «голос → агент» уже сегодня быстрее, чем «клавиатура → чат». Именно поэтому я считаю голосовой ввод частью Codex First, а не отдельной игрушкой.

Приватность: облако или локально

🔒
Если диктуете чувствительные данные, смотрите, где идёт распознавание. Wispr Flow и Aqua Voice работают только через облако. Spokenly, VoiceInk, Handy и Google Eloquent умеют обрабатывать речь локально на устройстве. Для рабочих и клиентских данных я выбираю локальные модели или хотя бы понимаю, куда уходит аудио.

Бонус: ещё варианты

  • OpenWhispr — бесплатное кроссплатформенное приложение с открытым кодом (macOS, Windows, Linux): локальные модели Whisper/Parakeet, облако по своему ключу и режим агента. Опциональный Pro — около $8/мес.
  • Для русского языка — если нужен сильный движок именно под русскую речь, посмотрите Silero и Yandex SpeechKit; о них есть отдельные материалы в базе знаний.

Ссылки

По теме

Если хотите так же убрать клавиатуру из рутины и перевести постановку задач на голос — соберём это под ваши инструменты.

Если захотите обсудить, как это применить у себя или в команде — пишите в Telegram @pimenov.