Фото: Iain Masterton / Alamy / Vida Press
истории

Почему Siri и другие виртуальные помощники не делают жизнь проще Спойлер: они тупые

Источник: Meduza

Крупнейшие IT-компании мира пытаются заставить нас пользоваться виртуальными помощниками. Apple упростила вызов Siri на телефонах и встроила ее в компьютеры; Google выпустила мессенджер со встроенным ботом-помощником; свои решения есть у Microsoft и Amazon. Но почему мы все еще не разговариваем с утра до ночи со своими телефонами, компьютерами и колонками? Журналист «Медузы» Султан Сулейманов перечисляет главные недостатки виртуальных ассистентов. 


1. Они нас не слышат

Речь, конечно, идет именно о голосовых помощниках — будь то Siri в устройствах Apple, ассистент от Google в телефонах на Android или «умная колонка» Amazon Echo. Чтобы не приходилось каждый раз нажимать на кнопку, производители научили их реагировать на определенные команды — например, на «Окей, Гугл».

Правда, на практике срабатывают эти команды не с первого раза. Из-за этого пользователь выглядит попугаем, повторяющим разными выражениями (чтобы телефон понял): «Окей, Гугл. Окэй, Гугл. Оу-кей, Гугл. О-о-окей, Гу-угл». Если это происходит в людных местах, пользователь сто раз подумает, прежде чем начать пользоваться помощником. 

Окей Гугл (OK Google), найди мне кого-нибудь, кто круче меня — Чеченец

Palbu.ru

2. Они нас не понимают

Проблема не только в качестве распознавания наших команд — иногда телефонам (и встроенным в них нейросетям) удается расшифровать то, что едва способен понять человек. Но затем мы получаем ответ, и нередко этот ответ совсем не соответствует нашим ожиданиям.

Производители уверяют, что «умные помощники» настолько умны, что с ними можно общаться по-человечески — то есть свободно формулировать фразы и даже вести диалоги, когда следующий запрос частично завязан на предыдущем. На деле все общение выглядит просто как переход от команды «погода в Москве сегодня» до «какая сегодня будет погода?» (или в более продвинутом случае «сегодня будет дождь?»). И этот переход едва ли можно считать качественным скачком — пользователю все равно нужно произносить определенные, почти жестко заданные команды, чтобы получить ожидаемый ответ.

3. Мы не знаем, что они умеют

На промороликах обычно показывают счастливых людей, которые дают виртуальным ассистентам разные команды, а те охотно их исполняют. Проблема в том, что герои этих видео четко знают, что их устройства умеют, а что нет.

В жизни все иначе. Пользователи постоянно сталкиваются с тем, что ассистент не умеет делать те или иные — довольно примитивные — вещи, и вместо ожидаемых действий выдает бесполезную поисковую выдачу. При этом разные ассистенты наделены разным набором функций, из-за чего запомнить, кто что умеет, невозможно.

Хуже того, разнообразие наблюдается даже внутри одной экосистемы. Например, менеджер заметок Google Keep, который встроен в телефоны на Android, умеет создавать напоминания, привязанные к конкретной точке на карте, но «умный» бот, встроенный в мессенджер Allo, с этим справиться не может. Как и понять простейшую команду «напомни мне об этом через пару часов», связанную с его же предыдущим сообщением.

Подобные проблемы знакомы и пользователям Siri. Разница лишь в том, что в маркетинговых целях в ассистента от Apple встроили ряд развлекательных команд (вроде «спой песенку» или «сколько будет 0 делить на 0?»), из-за которых она кажется чуть-чуть умнее.

4. Они записывают нас

Голосовые помощники устроены так: они записывают вашу команду, отправляют ее на сервер, а там голос расшифровывают и присылают ответ. Но запись вашего голоса остается на серверах.

Google дает пользователям прослушать то, что он сохранил, и это очень страшно. В этот момент понимаешь, что у корпорации в руках не только текстовые запросы (о которых в случае чего можно сказать: это не я, это кот по клавиатуре пробежал), но и фразы, произнесенные твоим голосом.

Итог: они годятся только для примитивных вещей

С голосовыми помощниками нет проблем, когда используешь их для пары-тройки очень простых задач: узнать погоду, включить музыку, позвонить маме (и то только если в списке контактов только один номер записан как «Мама»). Для всего остального они слишком неудобные.

Султан Сулейманов

Рига

Magic link? Это волшебная ссылка: она открывает лайт-версию материала. Ее можно отправить тому, у кого «Медуза» заблокирована, — и все откроется! Будьте осторожны: «Медуза» в РФ — «нежелательная» организация. Не посылайте наши статьи людям, которым вы не доверяете.