Що таке Deepfake і чи варто мене хвилювати?

Наша схильність довіряти відео- та аудіоматеріалам є загальновідомою. Проте, завдяки можливостям штучного інтелекту, відтворення будь-якого обличчя або голосу стало настільки точним, що межі між реальністю та імітацією стають розмитими. Такі імітації, відомі як дипфейки, можуть використовуватись у різних цілях, починаючи від створення мемів і закінчуючи поширенням дезінформації або навіть непристойних матеріалів.

Ознайомлення з такими прикладами, як дипфейк з Ніколасом Кейджем або публічна служба з Джорданом Пілом, миттєво демонструє дивовижний потенціал цієї нової технології. Хоча ці конкретні приклади можуть здаватися нешкідливими, вони піднімають важливі питання про майбутнє. Чи можемо ми й надалі довіряти відео- та аудіозаписам? Як ми можемо притягнути до відповідальності тих, чиї дії відображені на екрані? І чи готові ми до світу, де дипфейки стають нормою?

Дипфейки: нова, доступна та швидкорозвивальна технологія

Технологія дипфейків існує лише кілька років, але вже встигла трансформуватися у явище, що одночасно захоплює та викликає занепокоєння. Термін “deepfake”, який з’явився на Reddit у 2017 році, використовується для опису процесу відтворення зовнішнього вигляду або голосу людини за допомогою штучного інтелекту. Найбільш вражаючим є те, що практично будь-хто, хто має потужний комп’ютер, спеціалізоване програмне забезпечення та кілька годин вільного часу, може створити дипфейк.

Здивуєтесь, але зображення зліва є дипфейком.

Як і з будь-якою новою технологією, навколо дипфейків виникає певна плутанина. Відео “П’яна Пелосі” є яскравим прикладом цієї плутанини. Дипфейки створюються штучним інтелектом і призначені для того, щоб видавати себе за реальних людей. Однак відео “П’яна Пелосі”, яке часто помилково називають дипфейком, насправді є лише відеозаписом Ненсі Пелосі, де швидкість відтворення було сповільнено, а тембр голосу змінено, щоб створити ефект нечіткої вимови.

Саме це відрізняє дипфейк від, наприклад, CGI Керрі Фішер у фільмі “Зоряні війни: Бунтар Один”. У той час як компанія Disney витратила значні кошти на дослідження обличчя Керрі Фішер і ручне відтворення його, фахівець з програмним забезпеченням для дипфейків може виконати ту ж роботу безкоштовно протягом одного дня. ШІ робить цей процес неймовірно простим, дешевим і переконливим.

Як створюються дипфейки?

Подібно до учня, штучний інтелект повинен “навчитися” виконувати поставлене завдання. Це відбувається через процес спроб і помилок, відомий як машинне навчання або глибоке навчання. Наприклад, ШІ, розроблений для проходження першого рівня Super Mario Bros, буде грати знову і знову, поки не знайде найефективніший спосіб перемогти. Людина, яка розробляє ШІ, має надати вихідні дані, а також кілька “правил” на випадок виникнення помилок. Після цього ШІ виконує всю роботу.

Аналогічний процес використовується для створення дипфейків з обличчями. Однак, відтворити обличчя – це не те саме, що пройти відеогру. Для створення дипфейка Ніколаса Кейджа, який веде шоу Венді Вільямс, нам знадобиться наступне:

Відео-зразок: на сьогодні дипфейки найкраще працюють із чіткими відео високої якості. Саме тому деякі з найпереконливіших дипфейків створені на основі відео з політиками, які, як правило, стоять нерухомо на подіумі при постійному освітленні. Отже, нам потрібне відео, де Венді сидить на місці й розмовляє.

Два набори даних: щоб рухи рота та голови виглядали точними, нам потрібні зображення обличчя Венді Вільямс, а також Ніколаса Кейджа. Якщо Венді дивиться вправо, нам потрібна фотографія Ніколаса Кейджа, який дивиться вправо. Якщо Венді відкриває рот, потрібне фото Кейджа, який відкриває рот.

Після надання цих даних ми дозволяємо ШІ виконувати свою роботу. Він намагається створити дипфейк знову і знову, навчаючись на своїх помилках. Просто, чи не так? Ну, насправді не так просто накласти обличчя Кейджа на відео Венді Вільямс.