Голосовые ИИ-ассистенты в 2025: кто реально работает, а кто

Несколько недель назад я попробовал провести целый день, общаясь с телефоном голосом — без клавиатуры. Рабочие задачи, напоминания, поиск информации, даже черновики текстов. Идея была простая: посмотреть, насколько это вообще реально в 2025 году. К обеду я сдался. Но не потому что ассистенты стали хуже — а потому что понял, где у каждого из них граница, за которую они не выходят.

Вот что получилось из этого эксперимента.

Siri всё ещё живёт в 2019-м

Начал с Siri — iPhone был под рукой. Первые пять минут всё шло хорошо: таймер поставить, музыку включить, позвонить кому надо. Но стоило попросить что-то чуть сложнее — найти конкретную статью по теме и кратко пересказать её — как она выдала ссылку на поиск. Спасибо, Siri, я и сам умею нажать на значок Safari.

Apple весь прошлый год много говорила про Apple Intelligence и интеграцию с ChatGPT. На практике это работает ровно настолько, насколько ты готов к тому, что Siri переключается в ChatGPT посередине разговора — и ты уже не понимаешь, кто тебе отвечает. Переход есть, но он неловкий. Как будто менеджер на полуслове передаёт трубку коллеге.

Для базовых системных задач — управление телефоном, таймеры, напоминания — Siri удобная. За пределами этого я перестал на неё рассчитывать.

Google Assistant умер, да здравствует Gemini

Где-то в середине 2024-го Google окончательно начал переводить всё на Gemini. И это чувствуется. Ответы стали заметно длиннее и осмысленнее. Gemini явно понимает контекст лучше, чем старый Ассистент, который часто делал вид, что не расслышал.

Я попробовал один реальный рабочий кейс: надиктовал задачу — "найди мне три конференции по ML в Европе в этом году, с датами и городами". Старый Google Assistant тут просто открыл браузер. Gemini попытался ответить напрямую и назвал несколько вариантов — один оказался устаревшим, но всё равно это уже другой разговор.

Дело в том что самое полезное в Gemini открывается, когда он встроен в рабочие инструменты Google. В Docs и Gmail голосовой ввод с его подсказками работает неплохо. Не идеально, но не бесполезно — а это уже что-то.

ChatGPT Voice: умный, но с характером

ChatGPT с голосовым режимом — это отдельная история. Пользуюсь им довольно регулярно, и вот что заметил: он реально хорош для разговора. Именно для разговора, а не для команд.

Если нужно "включи свет" — ChatGPT не про это. Но если надо обдумать идею вслух, получить обратную связь на черновик, разобраться в незнакомой теме — вот здесь он работает так, как никакой другой голосовой интерфейс не работает. Я несколько раз надиктовывал ему черновики постов прямо во время прогулки. Он задавал уточняющие вопросы, предлагал переформулировки. Это было похоже на разговор с редактором, который не обижается, когда ты говоришь "нет, не то, переделай".

С другой стороны, у него нет доступа к моим данным, календарю, файлам — если только не настроить это отдельно. Поэтому как "персональный ассистент" в классическом смысле он работает лишь частично.

Amazon Alexa: умный дом, и только

Про Alexa скажу коротко, потому что для меня она занимает очень конкретную нишу — умный дом. Свет, розетки, термостат, музыка через колонку. Здесь она стабильна и надёжна. За пределами этой ниши у меня с ней никогда ничего интересного не получалось.

Amazon в феврале 2025-го запустила обновлённую Alexa+ с новой моделью под капотом — по отзывам она стала лучше в разговорном режиме. Я сам не тестировал новую версию достаточно плотно, поэтому выводов делать не буду. Но ощущение, что Amazon целится в ту же аудиторию что и раньше: люди с Echo-устройствами дома, которым нужна надёжная голосовая автоматика, а не собеседник.

Как это всё на самом деле выглядит в жизни

Три кейса из моей практики за последние месяцы — без прикрас.

Голосовые заметки в ChatGPT я теперь записываю регулярно, когда идея приходит на ходу. Потом прошу превратить это в структурированный черновик. Работает хорошо — особенно если не бояться, что первая надиктованная версия звучит как бред.

Управление умным домом через Alexa я наконец перестал воспринимать как игрушку. Говоришь "выключи всё в спальне" — и всё выключается. Потратил час на настройку год назад и с тех пор почти не думаю об этом.

Третий кейс — неудачный. Я пробовал использовать Gemini как голосового секретаря в течение рабочей недели: напоминания, планирование, суммаризация. Сломался на второй день. Контекст не сохранялся между разговорами, интеграция с календарём работала через раз. Может, у других это складывается лучше — у меня не сложилось.

Что реально изменилось в 2025-м

Главное изменение — не то что ассистенты стали умнее, хотя это тоже правда. Главное что они перестали быть одинаковыми. Раньше всё сводилось к тому, у кого лучше распознавание речи. Теперь у каждого есть своя область, где он сильнее.

ChatGPT хорош для мышления и текстовых задач. Gemini — для работы в экосистеме Google. Alexa — для умного дома. Siri — для базового управления iPhone. Попытки сделать из одного ассистента всё сразу пока работают плохо — именно это я почувствовал в тот день, когда пробовал обойтись без клавиатуры.

Не думаю что в ближайший год это сильно изменится. Голосовой интерфейс всё ещё требует от пользователя больше усилий, чем кажется. Надо знать, как формулировать запросы, понимать что ассистент умеет, а что нет — и не злиться, когда он в четвёртый раз открывает браузер вместо того чтобы просто ответить на вопрос.

Но кое-что уже работает. И это "кое-что" стало заметно больше, чем год назад.