Пристрої Alexa завжди в режимі очікування, але не здійснюють постійного запису. Вони не відправляють жодної інформації на хмарні сервери до моменту, коли розпізнають кодове слово (Alexa, Echo або Computer). Однак, розпізнавання цих слів є складнішим процесом, ніж здається на перший погляд.
Самі пристрої Echo не відрізняються інтелектом. Без доступу до Інтернету, будь-які запити, які ви до них адресуєте, залишаться без відповіді. Це зумовлено тим, що голосові команди відправляються до хмарного середовища для обробки та аналізу. Компанія Amazon прагне уникнути запису кожної вашої розмови перед розумним динаміком, а лише тих команд, які ви свідомо йому даєте. Саме тому використовується кодове слово, що привертає увагу пристрою. Для цього Amazon застосовує комбінацію прецизійно налаштованих мікрофонів, короткочасний буфер пам’яті та механізми навчання нейронної мережі.
Прецизійні мікрофони точно визначають джерело звуку
Світловий індикатор блакитного кольору завжди спрямований у напрямку голосу користувача.
Голосові помічники, такі як Echo та Echo Dot, мають декілька вбудованих мікрофонів. Наприклад, Echo Dot оснащений сімома. Такий масив дозволяє пристроям виконувати ряд функцій, включаючи виявлення команд, вимовлених на відстані, та відокремлення голосу користувача від фонового шуму.
Останнє є особливо важливим для розпізнавання кодового слова. Використовуючи декілька мікрофонів, Echo може точно визначити, де саме знаходиться джерело звуку, і фокусуватись на цьому напрямку, ігноруючи решту приміщення.
Це можна помітити щоразу, коли використовується кодове слово. Спробуйте стати збоку від Echo або Echo Dot і вимовити його. Зверніть увагу, як кільце засвічується темно-синім, а потім світлішим синім кольором, обертаючись і “вказуючи” на вас. Після цього відійдіть на кілька кроків вбік і повторіть кодове слово. Ви побачите, що світло-блакитні індикатори знову прослідують за вами.
Здатність визначати ваше місцезнаходження дозволяє пристрою краще концентруватись на вашому голосі та відфільтровувати сторонній шум.
Обмежена пам’ять захищає приватність
Пристрої Echo оснащені значною пам’яттю, але використовують її дуже обмежено. За словами Рохіта Прасада, віце-президента Amazon та головного наукового співробітника з питань штучного інтелекту Alexa, Echo може зберігати лише кілька секунд аудіо.
Обмежуючи можливості зберігання, Amazon не тільки підвищує вашу конфіденційність, але і не дозволяє Echo прослуховувати цілі діалоги, фокусуючись виключно на розпізнаванні кодового слова.
Уявіть, що ви маєте трисекундну аудіокасету та магнітофон. Після закінчення стрічки, вона автоматично повертається на початок для повторного запису. Таким чином, якщо ви почнете записувати розмову, все, що ви сказали чотири секунди тому, буде миттєво стерто. Подібний принцип використовується в Amazon Echo.
Пристрій постійно записує звук, але паралельно видаляє все, що було записано мить тому. Такий короткий проміжок часу означає, що все, що він може запам’ятати – це кодове слово “Alexa” і нічого більше. Трьох секунд достатньо, щоб записати слово, проаналізувати його та відреагувати належним чином.
Нейронна мережа розпізнає патерни
Візуалізація рівнів, що використовуються алгоритмами Amazon.
Amazon використовує навчання нейронних мереж для навчання Echo розпізнавати кодове слово. Як і в інших формах машинного навчання, Amazon постійно тренує алгоритми, подаючи їм велику кількість прикладів слова “Alexa” (або “Computer” чи “Echo”, залежно від кодового слова).
Мета полягає в тому, щоб врахувати всі можливі варіації вимови, акценти та контекст. Amazon прагне навчити Echo розрізняти, коли ви звертаєтесь до нього, коли ви говорите про нього, або, можливо, коли ви спілкуєтеся з людиною на ім’я Alexa. Спрямовані мікрофони також допомагають у цьому процесі.
Кожне почуте слово проходить через багаторівневу систему алгоритмів. Кожен рівень розроблено для відфільтрування хибних спрацювань, пошуку подібних звуків або контекстних підказок. Якщо слово проходить перевірку на одному рівні, воно переходить до наступного. Зрештою, якщо локальний пристрій визначає, що почув кодове слово, він починає записувати звук та відправляти його на хмарні сервери Amazon. Amazon використовує чотири окремі алгоритми: по одному для кожного кодового слова (Alexa, Computer, Echo) та один для Alexa Guard, який розпізнає конкретні звуки, наприклад, розбиття скла.
Навіть після розпізнавання кодового слова, Amazon проводить додаткові, складніші перевірки. Ви, напевно, помічали, що коли хтось вимовляє слово “Alexa” в телевізійній передачі чи рекламі, це зазвичай не викликає відповіді від вашого Echo. Це відбувається тому, що Amazon проводить додаткову хмарну перевірку.
Хмарні перевірки зменшують хибні спрацювання
Ця реклама Alexa не активує ваш пристрій.
Компанії, які створюють рекламні ролики з використанням Alexa, мають можливість передати аудіо до Amazon. Компанія аналізує аудіо за допомогою алгоритмів, подібних до тих, що використовуються для розпізнавання кодового слова. Після того, як конкретний приклад повністю проаналізовано, він додається до спеціальної бази даних.
Під час звернення до хмарного середовища, ваш Echo надсилає інформацію про почуте кодове слово та перевіряє його на відповідність з базою даних. Якщо виявлено збіг, Amazon наказує вашому Echo ігнорувати кодове слово, вимкнутись та видалити будь-який записаний звук.
Крім цього, Amazon перевіряє випадки одночасного вимовлення кодового слова. Не кожна компанія передає аудіо в Amazon, тому була розроблена резервна система. Після перевірки за базою даних, компанія порівнює відбиток кодового слова з будь-якими іншими прикладами, які надходять одночасно. Малоймовірно, що дві людини, які одночасно вимовляють слово “Alexa”, будуть звучати абсолютно ідентично. Таким чином, якщо є збіг, Amazon розпізнає, що це, швидше за все, реклама або телевізійний контент, і ігнорує запит.
Незважаючи на всі ці заходи безпеки, випадкові помилки все ж трапляються. Ви можете прослухати аудіозаписи, які зберігає ваш пристрій, через Центр конфіденційності Amazon, і ви, найімовірніше, знайдете хоча б один хибний запис. Однак технологія постійно вдосконалюється, і компанія Amazon прагне, щоб в майбутньому вона працювала без помилок.