Що таке Deepfake і чи варто мене хвилювати?

| | 0 Comments| 2:05 AM
Categories:

Ми схильні довіряти вмісту відео та аудіозаписів. Але за допомогою штучного інтелекту будь-яке обличчя або голос можна відтворити з точністю. Продукт є дипфейком, імітацією, яку можна використовувати для мемів, дезінформації чи порно.

Один погляд на Ніколас Кейдж дипфейк або Джордан Піл deepfake PSA дає зрозуміти, що ми маємо справу з дивною новою технологією. Ці приклади, хоча і відносно нешкідливі, викликають питання про майбутнє. Чи можна довіряти відео та аудіо? Чи можемо ми притягнути людей до відповідальності за їхні дії на екрані? Чи готові ми до дипфейків?

Дипфейки нові, їх легко зробити і швидко розвиваються

Технології Deepfake всього кілька років, але вона вже вибухнула у щось, що одночасно захоплює і тривожить. Термін «deepfake», який був придуманий на сайті Reddit у 2017 році, використовується для опису відтворення зовнішності або голосу людини за допомогою штучного інтелекту. Дивно, але практично будь-хто може створити дипфейк за допомогою жахливого ПК, певного програмного забезпечення та кількох годин роботи.

  Як додати контакт у Skype

Вірте чи ні, але зображення зліва – це дипфейк.

Як і з будь-якою новою технологією, навколо глибоких фейків є деяка плутанина. Відео «П’яна Пелосі» є чудовим прикладом цієї плутанини. Дипфейки створені штучним інтелектом, і вони створені для того, щоб видавати себе за людей. Відео «Dunk Pelosi», яке називають дипфейком, насправді є лише відео Ненсі Пелосі, яке було сповільнений і виправлений тон щоб додати ефект нечіткої мови.

Це також те, що відрізняє дипфейк від, скажімо, CGI Керрі Фішер у Star Wars: Rogue One. У той час як Дісней витратив купу грошей, вивчаючи обличчя Керрі Фішер і відтворюючи його вручну, ботанік із деяким програмним забезпеченням для глибоких фейків може виконувати ту ж роботу безкоштовно за один день. ШІ робить роботу неймовірно простою, дешевою та переконливою.

  Наскільки безпечні громадські зарядні станції?

Як зробити Deepfake

Як і студент у класі, ШІ повинен «навчитися», як виконувати призначене завдання. Це робиться за допомогою процесу проб і помилок методом грубої сили, який зазвичай називають машинним навчанням або глибоким навчанням. Наприклад, штучний інтелект, призначений для проходження першого рівня Super Mario Bros, буде грати в гру знову і знову, поки не знайде найкращий спосіб перемогти. Людині, яка розробляє ШІ, потрібно надати деякі дані, щоб почати роботу, а також кілька «правил», коли щось піде не так. Крім цього, ШІ виконує всю роботу.

Те ж саме стосується глибокої фейкової рекреації обличчя. Але, звісно, ​​відтворити обличчя – це не те саме, що побити відеоігри. Якби ми створили дипфейк Ніколаса Кейджа, який веде шоу Венді Вільямс, ось що нам знадобиться:

  Що таке обробка природної мови і як вона працює?

Відео призначення: на даний момент глибокі фейки найкраще працюють із чіткими, чистими відеоролики призначення. Ось чому деякі з найпереконливіших дипфейків – це політика; вони, як правило, стоять нерухомо на подіумі при постійному освітленні. Отже, нам просто потрібне відео Венді, яка сидить на місці й розмовляє.
Два набори даних: щоб рухи рота та голови виглядали точними, нам потрібен набір даних обличчя Венді Вільямс і набір даних обличчя Ніколаса Кейджа. Якщо Венді дивиться праворуч, нам потрібна фотографія Ніколаса Кейджа, яка дивиться праворуч. Якщо Венді відкриє рот, нам потрібна фотографія Кейджа, який відкриває рот.

Після цього ми дозволяємо штучному інтелекту виконувати свою роботу. Він намагається створювати дипфейк знову і знову, навчаючись на своїх помилках. Просто, правда? Ну, відео обличчя Кейджа на відео Венді Вільям