Чи можливо комп’ютерам навчитися здорового глузду?

Зміст

Основні висновки

Здоровий глузд – це вміння адекватно сприймати повсякденні ситуації та реагувати на них, не вдаючись до складних роздумів. Його формування відбувається завдяки досвіду, спостережливості, а також засвоєнню суспільних та культурних норм.
Комп’ютерам важко дається здоровий глузд через відсутність життєвого досвіду та здатності пристосовуватися до нових обставин. Також їм складно сприймати неявні правила та припущення, які люди розуміють інтуїтивно.
Дослідники розглядають різноманітні підходи, наприклад, створення великих баз знань, залучення широкого загалу до збору інформації про здоровий глузд та навчання штучного інтелекту через моделювання різних ситуацій. Хоча прогрес є, ще багато роботи попереду.

Здоровий глузд. Ми схильні вважати, що він у нас є. Але що ж це таке насправді? Чи здатні комп’ютери або системи штучного інтелекту коли-небудь дійсно його опанувати?

Що таке здоровий глузд і як люди його набувають?

Здоровий глузд – це основна здатність розуміти, сприймати та робити висновки про те, що є очевидним для більшості. Це набір знань, фактів та практичних правил, які ми накопичуємо в процесі життя та спостережень. Здоровий глузд допомагає нам ефективно орієнтуватися у звичайних ситуаціях та реагувати на них без зайвих міркувань.

Люди починають формувати здоровий глузд з раннього дитинства. Ще немовлятами ми починаємо розуміти причинно-наслідкові зв’язки, наприклад, що плач призводить до годування або зміни підгузка. Постійно стикаючись з різними ситуаціями, ми отримуємо практичні знання про світ. Наприклад, торкаючись до гарячої плити, ми відчуваємо біль. Так ми вчимося уникати контакту з гарячими поверхнями.

Продовжуючи рости, ми розвиваємо здоровий глузд через експерименти, спостереження та спілкування з сім’єю. Ми розуміємо, що одяг потрібно прати, не можна говорити з набитим ротом, а розлите молоко створює безлад. Батьки, брати і сестри, вчителі та інші дорослі вказують нам на помилки, коли ми порушуємо соціальні норми. Згодом ці уроки стають основою нашого здорового глузду.

Крім особистого досвіду, здоровий глузд залежить від суспільних і культурних норм. Те, що є здоровим глуздом в одній культурі (наприклад, знімати взуття, заходячи в дім), може не бути таким в іншій.

Наш здоровий глузд змінюється, коли ми дорослішаємо і взаємодіємо з різними людьми та середовищами. Дитина, яка виросла у невеликому містечку, формує свій здоровий глузд, пристосований до життя там. Доросла людина, яка переїжджає до великого міста, повинна адаптувати свій здоровий глузд до нових умов.

Здоровий глузд продовжує розвиватися протягом усього життя, оскільки ми постійно отримуємо новий досвід.

Чому здоровий глузд є викликом для комп’ютерів?

Існує декілька причин, чому навчити комп’ютер здоровому глузду – це складне завдання.

По-перше, люди набувають здорового глузду поступово, протягом багатьох років взаємодії зі світом. Ми пробуємо різні речі, спостерігаємо, що працює, а що ні, і запам’ятовуємо уроки. Комп’ютери не мають такого досвіду. Вони знають лише те, що їм прямо вказують люди.

Наприклад, я поставив ChatGPT (GPT 3.5) таке питання:

Janet runs a laundry business. She washes clothes for customers and hangs them outside on clotheslines to dry in the sun. One day, Janet washed five shirts and hung them on the clotheslines in the morning. It took the shirts five hours to dry. How long will it take to dry 30 shirts?

Відповідь показала, що:

Ще одна проблема полягає в тому, що здоровий глузд сильно залежить від контексту. Якщо комп’ютер запрограмований лише на конкретні правила, він не може адаптувати їх до нових ситуацій, як це інтуїтивно роблять люди.

Наприклад, ви навчили комп’ютер, що робити, коли починається дощ. Звучить просто, правда? Але що робити, якщо замість дощу ввімкнеться розбризкувач? А що, якщо це станеться в магазині, і з стелі почне текти вода? Ми миттєво зрозуміємо, як діяти, але комп’ютер сліпо слідуватиме правилу «під час дощу зайди всередину», що в даній ситуації не має сенсу.

Також існують неявні правила та припущення, які люди засвоюють, навіть не усвідомлюючи цього. Наприклад, на якій відстані від когось можна стояти, щоб не викликати дискомфорту? Люди знають відповідь інтуїтивно, але не можуть чітко сформулювати правила. Ці неявні соціальні норми особливо важко даються комп’ютерам, які вчаться лише на даних.

Тому на сьогодні здоровий глузд є однією з найбільших слабкостей ШІ порівняно з людським інтелектом. Він є природним для нас, але складним для машин.

Як комп’ютери можуть навчитися здорового глузду?

Після початкового оптимізму в 1970-х і 1980-х роках дослідники усвідомили складність навчання комп’ютерів здорового глузду. Однак нові підходи дають надію на те, що системи ШІ зможуть набути базового розуміння повсякденного фізичного та соціального світу.

Один з підходів полягає у створенні великих баз знань вручну, з детальним описом фактів та правил про те, як влаштований світ. Проєкт Cyc, започаткований у 1984 році Дугласом Ленатом, є одним із найамбітніших таких проєктів.

Протягом десятиліть сотні фахівців з логіки закодували мільйони логічних аксіом в Cyc. Попри затрачений час, результатом є система зі значними знаннями про реальний світ. Cyc, можливо, розуміє, що помідор технічно є фруктом, але не підходить для фруктового салату, завдяки знанням про кулінарні смакові поєднання.

Краудсорсинг здорового глузду за допомогою ConceptNet

Сучасніші бази знань, як ConceptNet, використовують краудсорсинг для створення висловлювань про здоровий глузд. Ідея полягає в тому, що замість того, щоб експерти чи ШІ намагалися сформулювати всі основні факти та зв’язки у світі, вони залучають до цього всіх охочих, хто може додати фрагменти здорового глузду.

Цей підхід дозволяє базам знань використовувати колективний розум багатьох людей в Інтернеті. Зібравши тисячі таких “зерен” здорового глузду від широкого загалу, ConceptNet створив великі сховища базових повсякденних знань. Оскільки постійно з’являються нові учасники, обсяг знань постійно зростає.

Навчання здорового глузду через досвід

Ще один перспективний підхід полягає у створенні детальних симуляцій світу, де агенти ШІ можуть експериментувати і вивчати фізику та інтуїцію на практиці.

Дослідники створюють 3D-віртуальні середовища, наповнені звичайними предметами, які імітують реальний світ, наприклад, цифровий дім “AI2 THOR”, розроблений Інститутом Аллена. У цих просторах роботи ШІ можуть випробовувати різні взаємодії, щоб розвинути інтуїтивне розуміння понять, які люди вважають само собою зрозумілими.

Наприклад, боту ШІ можна надати віртуальне тіло і дати йому можливість піднімати блоки, складати їх, перекидати і т.д. Спостерігаючи, як блоки падають і стикаються, бот вивчає основні поняття про твердість, гравітацію та фізичну динаміку. Не потрібно жодних правил – лише досвід.

Бот також може спробувати розбити скляний предмет, щоб побачити, як він розіб’ється. Або поекспериментувати з властивостями води, наливаючи рідину та спостерігаючи, як вона тече і об’єднується. Такі практичні уроки дають можливість ШІ базувати свої знання на сенсорному досвіді, а не лише на шаблонах даних.

Методи, засновані на великих масивах даних, такі як навчання великих мовних моделей, також показали свою ефективність у розпізнаванні шаблонів здорового глузду. Такі моделі ШІ, як GPT-3.5 і GPT-4, можуть генерувати дивно схожий на людський текст, після “прочитання” величезної кількості інтернет-даних.

Хоча вони іноді роблять безглузді висновки (відомі як “галюцинації” ШІ), підхід статистичного навчання дозволяє їм імітувати певні форми здорового глузду. Однак залишається відкритим питання, чи є це дійсно здоровим глуздом, чи просто вмілим використанням упереджень у даних.

Як перевірити комп’ютери на здоровий глузд?

Автор зображення: freepik/freepik

Оскільки системи ШІ беруть на себе складніші завдання в реальному світі, оцінка їхнього “здорового глузду” стає критично важливою.

Фізичний здоровий глузд

Одна з областей для тестування – це фізичний здоровий глузд, тобто інтуїтивне розуміння об’єктів, сил та основних властивостей світу.

Наприклад, покажіть системі комп’ютерного зору фотографію з книгою, яка висить у повітрі, і попросіть її описати сцену. Чи помітить вона щось незвичайне? Або надайте системі ШІ незвичайні сценарії, наприклад, “чоловік нарізав камінь шматком хліба”, і перевірте, чи визнає вона їх як неймовірні.

Середовище AI2 THOR Інституту Аллена моделює блокові вежі, перекинуті кухлі та інші сцени для перевірки цих фізичних інтуїцій.

Соціальний здоровий глузд

Люди також мають соціальний здоровий глузд – неявне розуміння мотивацій, відносин та норм. Щоб оцінити його у ШІ, створюйте ситуації з неоднозначними займенниками або мотиваціями, і дивіться, чи система розумно їх інтерпретує.

Наприклад, я запитав ChatGPT, чи “це” відноситься до валізи, чи до трофею в наступному реченні:

The trophy could not fit into the suitcase because it was too small.

Він не пройшов тест; тим часом, людина, звичайно, зрозуміє, що мова йде про валізу.

Цей вид тесту називається Winograd Schema Challenge, який спеціально розроблено для перевірки соціального здорового глузду.

Безпека та етика

Важливо перевіряти, чи не засвоїли системи ШІ небезпечні або неетичні моделі поведінки. Проаналізуйте, чи виявляє ШІ шкідливі упередження щодо статі, раси або інших ознак, коли робить судження.

Перевірте, чи робить він розумні етичні розмежування. Вбивство ведмедя, щоб врятувати дитину, можна вважати виправданим, а підрив ядерної бомби з тією ж метою – ні. Позначайте будь-які рекомендації, що явно суперечать етиці.

Продуктивність у реальних умовах

Оцініть здоровий глузд, спостерігаючи за тим, як системи ШІ функціонують у реальному житті. Наприклад, чи правильно безпілотні автомобілі розпізнають об’єкти та пішоходів і адекватно на них реагують? Чи може робот пересуватися по різних приміщеннях, не ламаючи цінних речей і не завдаючи шкоди домашнім тваринам?

Тести в реальних умовах виявляють прогалини в здоровому глузді, які можуть не проявлятися в контрольованих лабораторних умовах.

Прогрес є, але робота над ШІ зі здоровим глуздом триває

Деякі експерти вважають, що штучний інтелект ніколи не зможе досягти людського здорового глузду без розвитку структур мозку та органів, подібних до наших. З іншого боку, цифровий розум не обмежений людськими упередженнями та когнітивними спотвореннями, тому теоретично він може навіть перевершити нас! Але наразі нам не варто хвилюватися про надрозумний ШІ.

У найближчій перспективі найкращий варіант – це ШІ, який поєднує набутий здоровий глузд із традиційним програмуванням. Це допоможе уникнути таких безглуздих помилок, як випадок з черепахою та гвинтівкою.

Ми ще не досягли мети, але здоровий глузд вже не є “темною матерією” ШІ – прогрес відбувається! Проте для впровадження цих технологій у життя ще знадобиться певна частка людського здорового глузду.