Несколько недель назад я попробовал провести целый день, общаясь с телефоном голосом — без клавиатуры. Рабочие задачи, напоминания, поиск информации, даже черновики текстов. Идея была простая: посмотреть, насколько это вообще реально в 2025 году. К обеду я сдался. Но не потому что ассистенты стали хуже — а потому что понял, где у каждого из них граница, за которую они не выходят.
Вот что получилось из этого эксперимента.
Siri всё ещё живёт в 2019-м
Начал с Siri — iPhone был под рукой. Первые пять минут всё шло хорошо: таймер поставить, музыку включить, позвонить кому надо. Но стоило попросить что-то чуть сложнее — найти конкретную статью по теме и кратко пересказать её — как она выдала ссылку на поиск. Спасибо, Siri, я и сам умею нажать на значок Safari.
Apple весь прошлый год много говорила про Apple Intelligence и интеграцию с ChatGPT. На практике это работает ровно настолько, насколько ты готов к тому, что Siri переключается в ChatGPT посередине разговора — и ты уже не понимаешь, кто тебе отвечает. Переход есть, но он неловкий. Как будто менеджер на полуслове передаёт трубку коллеге.
Для базовых системных задач — управление телефоном, таймеры, напоминания — Siri удобная. За пределами этого я перестал на неё рассчитывать.
Google Assistant умер, да здравствует Gemini
Где-то в середине 2024-го Google окончательно начал переводить всё на Gemini. И это чувствуется. Ответы стали заметно длиннее и осмысленнее. Gemini явно понимает контекст лучше, чем старый Ассистент, который часто делал вид, что не расслышал.
Я попробовал один реальный рабочий кейс: надиктовал задачу — "найди мне три конференции по ML в Европе в этом году, с датами и городами". Старый Google Assistant тут просто открыл браузер. Gemini попытался ответить напрямую и назвал несколько вариантов — один оказался устаревшим, но всё равно это уже другой разговор.
Дело в том что самое полезное в Gemini открывается, когда он встроен в рабочие инструменты Google. В Docs и Gmail голосовой ввод с его подсказками работает неплохо. Не идеально, но не бесполезно — а это уже что-то.
ChatGPT Voice: умный, но с характером
ChatGPT с голосовым режимом — это отдельная история. Пользуюсь им довольно регулярно, и вот что заметил: он реально хорош для разговора. Именно для разговора, а не для команд.
Если нужно "включи свет" — ChatGPT не про это. Но если надо обдумать идею вслух, получить обратную связь на черновик, разобраться в незнакомой теме — вот здесь он работает так, как никакой другой голосовой интерфейс не работает. Я несколько раз надиктовывал ему черновики постов прямо во время прогулки. Он задавал уточняющие вопросы, предлагал переформулировки. Это было похоже на разговор с редактором, который не обижается, когда ты говоришь "нет, не то, переделай".
С другой стороны, у него нет доступа к моим данным, календарю, файлам — если только не настроить это отдельно. Поэтому как "персональный ассистент" в классическом смысле он работает лишь частично.
Amazon Alexa: умный дом, и только
Про Alexa скажу коротко, потому что для меня она занимает очень конкретную нишу — умный дом. Свет, розетки, термостат, музыка через колонку. Здесь она стабильна и надёжна. За пределами этой ниши у меня с ней никогда ничего интересного не получалось.
Amazon в феврале 2025-го запустила обновлённую Alexa+ с новой моделью под капотом — по отзывам она стала лучше в разговорном режиме. Я сам не тестировал новую версию достаточно плотно, поэтому выводов делать не буду. Но ощущение, что Amazon целится в ту же аудиторию что и раньше: люди с Echo-устройствами дома, которым нужна надёжная голосовая автоматика, а не собеседник.
Как это всё на самом деле выглядит в жизни
Три кейса из моей практики за последние месяцы — без прикрас.
Голосовые заметки в ChatGPT я теперь записываю регулярно, когда идея приходит на ходу. Потом прошу превратить это в структурированный черновик. Работает хорошо — особенно если не бояться, что первая надиктованная версия звучит как бред.
Управление умным домом через Alexa я наконец перестал воспринимать как игрушку. Говоришь "выключи всё в спальне" — и всё выключается. Потратил час на настройку год назад и с тех пор почти не думаю об этом.
Третий кейс — неудачный. Я пробовал использовать Gemini как голосового секретаря в течение рабочей недели: напоминания, планирование, суммаризация. Сломался на второй день. Контекст не сохранялся между разговорами, интеграция с календарём работала через раз. Может, у других это складывается лучше — у меня не сложилось.
Что реально изменилось в 2025-м
Главное изменение — не то что ассистенты стали умнее, хотя это тоже правда. Главное что они перестали быть одинаковыми. Раньше всё сводилось к тому, у кого лучше распознавание речи. Теперь у каждого есть своя область, где он сильнее.
ChatGPT хорош для мышления и текстовых задач. Gemini — для работы в экосистеме Google. Alexa — для умного дома. Siri — для базового управления iPhone. Попытки сделать из одного ассистента всё сразу пока работают плохо — именно это я почувствовал в тот день, когда пробовал обойтись без клавиатуры.
Не думаю что в ближайший год это сильно изменится. Голосовой интерфейс всё ещё требует от пользователя больше усилий, чем кажется. Надо знать, как формулировать запросы, понимать что ассистент умеет, а что нет — и не злиться, когда он в четвёртый раз открывает браузер вместо того чтобы просто ответить на вопрос.
Но кое-что уже работает. И это "кое-что" стало заметно больше, чем год назад.
