00

Привет, компьютер, поговорим?

Привет, компьютер, поговорим?

Часть 2

Слова обретают смысл

Развитие голосового управления и машинного обучения в последние годы шагнуло далеко вперед. Распознавание слов работает все лучше и лучше. И скорость – это большое преимущество говорения по сравнению с печатанием. "Теперь задача заключается в том, чтобы сделать коммуникацию как можно более естественной", – говорит Скотт Хаффман (Scott Huffman), топ-менеджер Google.

 

В настоящее время голосовые ассистенты даже пользуются кратковременной памятью. Например, если у человека запланирована поездка из одного города в другой, он может спросить у Google-ассистента: "Сколько ехать до...?" Ассистент определит текущее расположение человека, вычислит время в пути с учетом пробок и даст ответ. В дальнейшем ассистент будет учитывать информацию о поездке. Если далее прозвучит вопрос "Какая там погода?", то ассистент "вспомнит", о каком городе идет речь. На первый взгляд может показаться, что это довольно просто. Но это не так. Еще недавно необходимо было спросить: "Какая погода в ...?", назвав город. А теперь ассистент понимает, о каком городе идет речь. И это – еще один шаг к естественной коммуникации с машинами. 

 

Более естественно звучат теперь и голоса, потому что за этими голосами стоят люди. Чтобы озвучить голосового ассистента, который говорит множество слов, программное обеспечение должно быть наполнено ими. Для этого дикторы проводят сотни часов в студиях звукозаписи и произносят миллионы предложений – часто бессвязных – с различными интонациями: весело, серьезно, нейтрально, вопросительно. Это помогает научить звуковую систему речи, близкой к человеческой. 

 

Границы искусственного интеллекта

 

"Создание голоса звуковой системы зависит от уровня машинного обучения: всему есть пределы", – говорит Дитрих Клаков (Dietrich Klakow), профессор обработки речи и сигналов в Университете Саарланда. И такие пределы – там, где нет обучающих данных, где человек сам не всегда уверен, какой ответ должен быть. Например, иронии и юмору нельзя научить машину. Не всегда машина может ответить на вопрос "почему". А вот там, где человек может привести примеры и дать однозначный правильный ответ – машинное обучение работает прекрасно. 

 

Мы можем наблюдать прогресс в развитии ассистентов. Разработчикам удалось придать каждой системе некоторую индивидуальность. Alexa может посмешить пользователей своеобразным юмором и «умеет» говорить, как Йода из «Звездных войн». Cortana может переводить. Изюминка Siri – наиболее естественная манера разговора.

 

Голосовые системы становятся все лучше, и это факт. Они проникают в новые сферы нашей жизни. А с голосовыми ассистентами – и искусственный интеллект. Поэтому эксперты считают, что мы должны учитывать риски: некоторые опасаются, что Alexa и ее аналоги могут «подслушать» конфиденциальную информацию.

 

Правда, разработчики утверждают, что системы не записывают речь человека непрерывно, а активируются только после ключевых слов. Но ведь от сбоев в работе системы никто не застрахован. С системой Google Home Mini такое уже было. Запись должна была активироваться голосовой командой «Окей, Google» и прикосновением пальца к корпусу устройства. Из-за дефекта некоторые колонки регистрировали прикосновение даже тогда, когда его не было. Функция была отключена.

 

И даже при нормальной работе умных колонок и систем на смартфонах есть проблема защиты информации. Записи ведущих голосовых ассистентов обрабатываются на серверах американских провайдеров и хранятся там в течение долгого времени. Для устройств Google и Amazon существует функция просмотра голосовых записей и удаления их по отдельности самим пользователем, если это необходимо.

 

Использование голосового управления

 

Несмотря на границы машинного обучения и существующие риски, голосовые команды, вероятно, станут основным инструментом управления уже в среднесрочной перспективе, считают эксперты. Вряд ли оно будет широко использоваться в общественных местах – например, в транспорте или в аэропортах. «В ситуациях, когда рядом находится много людей, голосовое управление может мешать другим, поскольку придется громко произносить команды», – считает куратор компьютерного музея «Хайнц Никсдорф Форум» (Heinz Nixdorf Forum) Майкл Миколайчак (Michael Mikolajczak). В таких местах более удобны сенсорные дисплеи. Мышками тоже будут пользоваться – в офисах, на рабочих местах. Но дома, в машине или в любом другом месте, где нам нужны свободные руки или мы не хотим двигаться, голосовое управление будет использоваться повсеместно.

 

Директор Института Хассо Платтнера Кристоф Майнель (Christoph Meinel) считает: «Было бы здорово, если бы голосовые помощники перешли на массовый рынок. Несколько лет назад они еще не очень привлекали владельцев бизнеса, и это замедляло их распространение. Но теперь все иначе благодаря развитию технологий».

 

Будем ли мы общаться с компьютером?

 

По мнению Майкла Миколайчака, по-настоящему естественное общение с компьютером пока остается лишь мечтой. Сейчас говорить с компьютером – означает только отдавать приказы, а это не общение. Ответ компьютера на вопрос – это не результат размышления, а только извлеченная из памяти информация. «Компьютер не может думать», – поясняет Миколайчак.

Профессор Клаков тоже считает: «До того момента, как мы сможем общаться с компьютером так же, как и друг с другом, пройдет очень много времени». И, вероятно, голосовое управление не заменит полностью графический интерфейс (поверхность, экран), а будет служить только дополнительным инструментом управления.

 

Возможно, кто-то из фанатов «Звездного пути» когда-нибудь вспомнит Скотти, который в раздражении требует клавиатуру («Клавиатура. Как раньше!»), когда компьютер не реагирует на слова.

 

Конец статьи

Возврат к списку

Хотите подписаться на статьи электронного журнала "Электрорешения"?