Alexa, Siri та Google не розуміють жодного слова

За останні кілька років такі голосові помічники, як Alexa, Google Assistant і Siri, пройшли довгий шлях. Але, незважаючи на всі їхні покращення, одне стримує їх: вони вас не розуміють. Вони занадто покладаються на конкретні голосові команди.

Зміст

Розпізнавання мовлення – це просто чарівний трюк

Голосові помічники вас не розуміють. У всякому разі, не зовсім. Коли ви розмовляєте з Google Home або Amazon Echo, він, по суті, перетворює ваші слова в текстовий рядок, а потім порівнює це з очікуваними командами. Якщо він знаходить точну відповідність, він дотримується набору інструкцій. Якщо це не так, він шукає альтернативу того, що робити на основі інформації, яку він має, і якщо це не спрацює, ви отримаєте повідомлення про помилку, наприклад «Вибачте, але я не знаю, що ». Це трохи більше, ніж спритність рук магії, щоб обдурити вас, щоб подумати, що вона розуміє.

Він не може використовувати контекстні підказки, щоб зробити найкраще припущення, або навіть використовувати розуміння подібних тем для прийняття своїх рішень. Підключити голосових помічників також неважко. Хоча ви можете запитати Alexa: «Чи працюєте ви на АНБ?» і отримати відповідь, якщо ви запитаєте «Ви таємно є частиною АНБ?» ви отримаєте відповідь «я не знаю цього» (принаймні на момент написання цієї статті).

Люди, які справді розуміють мову, так не працюють. Припустимо, ви запитаєте людину: «Що це за кларвена на небі? Той, що має арку і сповнений смугастих кольорів, таких як червоний, помаранчевий, жовтий і синій». Незважаючи на те, що klarvain є вигаданим словом, людина, яку ви запитали, може з контексту зрозуміти, що ви описуєте веселку.

Як використовувати жести трекпада на iPad

Хоча ви можете стверджувати, що людина перетворює мову на ідеї, людина може потім застосувати знання та розуміння, щоб зробити висновок. Якщо ви запитаєте людину, чи таємно вони працюють на АНБ, вони дадуть вам відповідь так чи ні, навіть якщо ця відповідь брехня. Людина не сказала б «я цього не знаю» на таке запитання. Те, що люди можуть брехати, це те, що приходить зі справжнім розумінням.

Голосові помічники не можуть вийти за межі свого програмування

Голосові помічники в кінцевому підсумку обмежені запрограмованими очікуваними параметрами, і блукання за їх межами порушить процес. Цей факт показує, коли в гру входять сторонні пристрої. Зазвичай команда для взаємодії з ними є дуже громіздкою, тобто «скажи виробнику пристрою надати необов’язковий аргумент». Точний приклад: «Скажіть Whirlpool призупинити сушарку». Для прикладу, який ще важче запам’ятати, Geneva Alexa майстерність керує деякими печами GE. Користувач навику повинен пам’ятати «скажи Женеві», а не «скажи GE», а потім решту команди. І хоча ви можете попросити її розігріти духовку до 350 градусів, ви не можете підвищити температуру ще на 50 градусів. Але людина могла б виконати ці прохання.

Amazon і Google дуже наполегливо працювали, щоб подолати ці перешкоди, і це видно. Якщо раніше для керування розумним замком вам доводилося виконувати наведену вище послідовність, тепер ви можете сказати «заблокувати вхідні двері». Раніше Алекса збентежила «розкажи мені жарт про собаку», але попросіть його сьогодні, і це спрацює. Вони додали варіанти команд, які ви використовуєте, але в кінцевому підсумку ви все одно повинні знати, яку команду потрібно сказати. Ви повинні використовувати правильний синтаксис у правильному порядку.

Як запланувати надсилання електронної пошти в Gmail

І якщо ви думаєте, що це дуже нагадує командний рядок, ви не помиляєтеся.

Голосові помічники — це модний командний рядок

Командний рядок вузько визначений для виконання простих завдань, але тільки якщо ви знаєте правильний синтаксис. Якщо ви відхилитеся від правильного синтаксису і введете dyr замість dir, то командний рядок видасть вам повідомлення про помилку. Ви можете використовувати псевдоніми, щоб легше запам’ятати команди, але ви повинні мати уявлення про те, якими були оригінальні команди, як вони працюють і як ефективно використовувати псевдоніми. Якщо ви не приділите час, щоб вивчити всі тонкощі командного рядка, ви ніколи не отримаєте від цього багато користі.

Голосові помічники нічим не відрізняються. Ви повинні знати, як правильно сказати команду або поставити запитання. І вам потрібно знати, як налаштувати групи для Google і Alexa, чому групування пристроїв є важливим, і як називати свої розумні пристрої. Якщо ви не виконаєте ці необхідні кроки, ви відчуєте розчарування, якщо попросите свого голосового помічника вимкнути дослідження лише для того, щоб запитати, «яке дослідження» слід вимкнути.

Навіть якщо ви використовуєте правильний синтаксис у правильному порядку, процес може зірватися. Або з неправильною відповіддю, або з несподіваним результатом. Два Google Homes в одному будинку можуть показувати погоду для дещо різних місць, навіть якщо вони мають доступ до однієї інформації облікового запису користувача та підключення до Інтернету.

У наведеному вище прикладі дається команда «Встановити таймер на півгодини». Центр Google Home створив таймер під назвою «Година», а потім запитав, скільки часу має бути таймер. І все ж повторення тієї ж команди три рази спрацювало правильно і створило 30-хвилинний таймер. Використання команди «Встановити таймер на 30 хвилин» працює правильно на більш послідовній основі.

10 найкращих безкоштовних сканерів і шашок портів

Хоча розмова з Google Home або Echo може бути більш плавною, під капотом голосові помічники та командні рядки працюють однаково. Можливо, вам не потрібно вивчати нову мову, але ви повинні вивчити новий діалект.

Вузьке розуміння голосових помічників обмежить зростання

Все це не заважає голосовим помічникам, таким як Google Assistant і Alexa, працювати достатньо добре (хоча Cortana – це інша історія). Google Assistant і Alexa і пристойно шукають запитання в Інтернеті, хоча не дивно, що Google краще в пошуках і може відповісти на основні запитання, як-от перетворення вимірювань і проста математика. За умови правильно налаштованого розумного дому та добре навченого користувача більшість команд розумного дому працюватимуть за призначенням. Але це сталося завдяки праці та зусиллям, а не інтелектуальному розумінню.

Раніше таймери та будильники були спрощеними. З часом було додано іменування, а потім можливість додавати час до таймера. Вони перейшли від спрощеного до більш складного. Голосові помічники можуть відповісти на більше запитань, і кожен день приносить нові навички та функції. Але це не продукт самозростання, яке походить від навчання та розуміння.

І нічого з цього не дає властивої здатності використовувати те, що відомо, щоб досягти невідомого. На кожну команду та запитання, які спрацьовують, завжди знайдеться три, які не працюють. Без прориву в штучному інтелекті, який надає людську здатність розуміти, голосові помічники зовсім не помічники. Це лише голосові командні рядки — корисні в правильному сценарії, але обмежені тими сценаріями, на які вони були запрограмовані.

Іншими словами: машини навчаються речам, але не можуть їх зрозуміти.