Главное с Google I/O 2026: автономные агенты, Gemini Spark с MCP-протоколом, ИИ внутри Android и мультимодальный Gemini Omni.
СейчасКак выбрать за 30 секунд
- Как выбрать за 30 секунд
- Wispr Flow — облачная диктовка для Mac, Windows и телефона
- Spokenly — локальные и облачные модели с режимом для агентов
- Superwhisper — диктовка и расшифровка встреч в одном приложении
- Aqua Voice — облачная модель с упором на точность и термины
- VoiceInk — локальная диктовка для Mac с открытым кодом
- Google AI Edge Eloquent — бесплатный офлайн-ввод на iPhone
- Handy — единственный в подборке с поддержкой Linux
- Сводная таблица
- Голос + Codex First: как это работает у меня
- Приватность: облако или локально
- Бонус: ещё варианты
- Ссылки
Голосовой ввод за последние два года перестал быть «диктофоном с распознаванием»: современные приложения превращают живую речь в чистый, отформатированный текст прямо в любом поле ввода. Ниже — разбор семи решений, которые я тестировал, и логика выбора под конкретные задачи.
Как выбрать за 30 секунд
- Нужно максимально гладко и на всех устройствах → Wispr Flow.
- Важна приватность и работа без облака → Spokenly, VoiceInk или Handy.
- Диктуете в кодинг-агента (Codex, Cursor) → Spokenly (MCP) или Aqua Voice (технический словарь).
- Хотите бесплатно и навсегда → Handy, Spokenly (локально) или Superwhisper (базовый тариф).
- Только iPhone и офлайн → Google AI Edge Eloquent.
Wispr Flow — облачная диктовка для Mac, Windows и телефона
Облачное приложение для голосового ввода в любом поле: автоматически убирает слова-паразиты, расставляет пунктуацию, поддерживает команды и форматирование. Более 100 языков.
- Платформы: macOS 11+, Windows 10+, iPhone (iOS 18.3+), Android 13+.
- Цена: бесплатно — 2000 слов в неделю на десктопе (Mac и Windows суммарно) плюс отдельно 1000 слов в неделю на iOS, на Android пока без лимита (ограниченное предложение). Pro — $15/мес помесячно или $12/мес при годовой оплате.
- Сильные стороны: самый гладкий результат «из коробки», одинаково работает на всех платформах, аккуратная пунктуация.
- Слабые стороны: транскрипция всегда идёт через облако — полностью офлайн не выйдет; на десктопе нет безлимита.
- Кому подойдёт: тем, кому нужен один инструмент на всех устройствах и кто не против облака.
Spokenly — локальные и облачные модели с режимом для агентов
Голосовой ввод с выбором между локальными моделями (Whisper, Parakeet) и облачными по вашему API-ключу. Есть MCP-сервер для кодинг-агентов и Agent Mode для голосового управления macOS.
- Платформы: macOS, iOS, Windows; одна подписка покрывает все.
- Цена: бесплатно — безлимитная локальная диктовка и облако по своему ключу (BYOK) за $0; Pro — $9.99/мес (встроенные облачные модели без своего ключа и дополнительные функции).
- Сильные стороны: бесплатный безлимит на локальных моделях, приватность, прямая связка с Claude Code и Cursor через MCP, 100+ языков.
- Слабые стороны: «беспроблемное» облако без своего ключа — только в Pro; интерфейс плотнее, чем у Wispr.
- Кому подойдёт: тем, кто диктует в кодинг-агентов и ценит локальную обработку.
Superwhisper — диктовка и расшифровка встреч в одном приложении
Голосовой ввод в любое приложение плюс запись и расшифровка встреч. Кастомные режимы и промпты, словарь, локальные и облачные модели.
- Платформы: macOS, Windows, iOS (Linux нет).
- Цена: бесплатный тариф — голосовой ввод в любых приложениях, запись встреч, 100+ языков, небольшие локальные модели и кастомный промпт; Pro — $8.49/мес, $84.99/год (≈$7.08/мес) или $249.99 разово (lifetime). Студентам скидка 40%.
- Сильные стороны: гибкие режимы под задачу (письмо, код, заметки), пожизненная лицензия, запись встреч.
- Слабые стороны: крупные локальные и облачные модели, разделение спикеров и словарь — только в Pro.
- Кому подойдёт: тем, кому нужен один инструмент и для диктовки, и для встреч, и кто готов один раз заплатить.
Aqua Voice — облачная модель с упором на точность и термины
Облачный голосовой ввод на собственной модели Avalon, заточенной под точность и технический лексикон.
- Платформы: macOS, Windows, iPhone.
- Цена: бесплатный Starter — 1000 слов суммарно (разово, не в месяц), движок Aqua и 5 слов в словаре; Pro — $8/мес при годовой оплате ($96/год), модель Avalon, словарь на 800 слов, безлимит; Team — $12/мес при годовой оплате.
- Сильные стороны: Avalon — лучшая на октябрь 2025 проприетарная модель в Open ASR Leaderboard, отлично распознаёт код и термины.
- Слабые стороны: только облако, офлайна нет ни на одном тарифе; 49 языков против 100+ у конкурентов; бесплатно — лишь 1000 слов на всё время.
- Кому подойдёт: тем, кому важна точность на терминах и коде и кто работает онлайн.
VoiceInk — локальная диктовка для Mac с открытым кодом
Локальное приложение для голосового ввода с открытым кодом: обработка на устройстве, опциональное облачное улучшение по своему ключу.
- Платформы: только macOS (Apple Silicon, macOS 14.4+).
- Цена: разовая покупка — $25 (1 Mac), $39 (2) или $49 (3); сейчас действует скидка 50%.
- Сильные стороны: полностью локально и приватно, открытый код (GPLv3, более 5000 звёзд на GitHub), оплата без подписки.
- Слабые стороны: только Mac на Apple Silicon — нет версий для Windows, iOS и старых Intel-маков.
- Кому подойдёт: пользователям Mac, которым нужна приватная локальная диктовка без подписки.
Google AI Edge Eloquent — бесплатный офлайн-ввод на iPhone
Бесплатное приложение Google с офлайн-распознаванием на встроенной модели Gemma: чистит слова-паразиты, полирует текст, ведёт личный словарь (можно импортировать из Gmail), есть опциональный гибридный режим с облачным Gemini.
- Платформы: iPhone и iPad (есть и версия для Mac); запуск — около апреля 2026.
- Цена: бесплатно.
- Сильные стороны: работает офлайн на устройстве, бесплатно, аккуратная чистка текста.
- Слабые стороны: первая версия ориентирована на английский и работает внутри приложения, а не системно во всех полях ввода.
- Кому подойдёт: владельцам iPhone, кому нужен бесплатный офлайн-ввод и кто пишет в основном по-английски.
Handy — единственный в подборке с поддержкой Linux
Бесплатное приложение с открытым кодом для офлайн-диктовки: модели Whisper и Parakeet, простая логика «нажал — продиктовал».
- Платформы: macOS, Windows, Linux. Собрано на Tauri (Rust), автор — CJ Pais.
- Цена: бесплатно, открытый код (MIT).
- Сильные стороны: единственное решение в подборке с Linux, полностью офлайн, бесплатно и открыто.
- Слабые стороны: слабее «причёсывает» текст и беднее по функциям, чем коммерческие аналоги.
- Кому подойдёт: разработчикам и тем, кто работает в Linux и хочет простой бесплатный офлайн-ввод.
Сводная таблица
| Приложение | Платформы | Локально/офлайн | Бесплатный тариф | Цена Pro |
| Wispr Flow | Mac, Windows, iOS, Android | Нет (облако) | 2000 слов/нед десктоп + 1000/нед iOS | $12–15/мес |
| Spokenly | Mac, Windows, iOS | Да | Локальный безлимит + BYOK | $9.99/мес |
| Superwhisper | Mac, Windows, iOS | Да | Ввод + встречи, малые модели | $8.49/мес или $249.99 разово |
| Aqua Voice | Mac, Windows, iOS | Нет (облако) | 1000 слов разово | $8/мес (год) |
| VoiceInk | macOS (Apple Silicon) | Да | Нет (платно, есть триал) | $25 разово |
| Google Eloquent | iPhone, iPad, Mac | Да | Бесплатно полностью | — |
| Handy | Mac, Windows, Linux | Да | Бесплатно полностью | — |
Голос + Codex First: как это работает у меня
Голос снимает трение между мыслью и постановкой задачи. На практике связка выглядит так:
- Длинную постановку задачи агенту я надиктовываю через Wispr Flow — получается связный промпт без «затыков» клавиатуры, даже на ходу.
- Для работы внутри кодинг-агента подключаю Spokenly: его MCP-сервер позволяет принимать голос прямо в Codex или Cursor.
- Короткие правки и сообщения Notion-агенту — тоже голосом.
Итог: «голос → агент» уже сегодня быстрее, чем «клавиатура → чат». Именно поэтому я считаю голосовой ввод частью Codex First, а не отдельной игрушкой.
Приватность: облако или локально
Бонус: ещё варианты
- OpenWhispr — бесплатное кроссплатформенное приложение с открытым кодом (macOS, Windows, Linux): локальные модели Whisper/Parakeet, облако по своему ключу и режим агента. Опциональный Pro — около $8/мес.
- Для русского языка — если нужен сильный движок именно под русскую речь, посмотрите Silero и Yandex SpeechKit; о них есть отдельные материалы в базе знаний.
Ссылки
- Wispr Flow
- Superwhisper
- Aqua Voice
- VoiceInk (GitHub)
- Handy (GitHub)
- OpenWhispr
- Spokenly
- Google AI Edge Eloquent
По теме
Если хотите так же убрать клавиатуру из рутины и перевести постановку задач на голос — соберём это под ваши инструменты.
Если захотите обсудить, как это применить у себя или в команде — пишите в Telegram @pimenov.
Если хотите разобрать свою задачу — напишите мне Если хотите разобрать свою задачу — напишите мне.
Можно прийти с идеей, черновым контекстом или уже живой задачей. Помогу быстро понять, где реальный следующий шаг, а где лишний шум.
Обычно хватает 2–3 сообщений, чтобы понять, могу ли я здесь реально помочь и в каком формате лучше двигаться дальше.
Связанные материалы
Пока рынок штампует текстовых ботов, голосовые ИИ-агенты остаются незанятой нишей с высокой маржой — особенно в сервисном бизнесе
Кейс: как я перестал вручную планировать консультации и собрал систему, которая сама создаёт созвоны, записывает видео, генерирует транскрипты и складывает всё обратно в карточку к…