Чи можливо комп’ютерам навчитися здорового глузду?

Ключові висновки

Здоровий глузд – це здатність розуміти повсякденні ситуації та реагувати на них без надмірного аналізу. Його набувають завдяки життєвому досвіду та спостереженням, а також суспільним і культурним нормам.
Комп’ютери борються зі здоровим глуздом, оскільки їм бракує досвіду реального світу та здатності адаптуватися до нових умов. Вони також борються з негласними правилами та припущеннями, які люди інтуїтивно розуміють.
Дослідники досліджують різні підходи, такі як створення обширних баз знань, краудсорсинг здорового глузду та навчання штучному інтелекту через симуляцію світів, щоб навчити комп’ютери набувати здорового глузду. Прогрес досягнуто, але ще є над чим працювати.

Здоровий глузд. Ми всі думаємо, що це у нас є. Але що саме це? Чи можуть комп’ютери чи системи штучного інтелекту коли-небудь справді його отримати?

Зміст

Що таке здоровий глузд і як люди його осягають?

Здоровий глузд — це базова здатність сприймати, розуміти й судити про те, що очікується від більшості людей. Це колекція фактів, інформації та практичних правил, які ми накопичуємо завдяки життєвому досвіду та спостереженням. Здоровий глузд дозволяє нам ефективно обробляти повсякденні ситуації та реагувати на них, не надто глибоко їх аналізуючи.

Люди починають набувати здорового глузду рано в дитинстві. Будучи немовлятами, ми починаємо вивчати причинно-наслідкові зв’язки, як плач призводить до того, що нас годують або переодягають. Завдяки багаторазовому досвіду ми отримуємо практичні знання про світ. Наприклад, дотик до гарячої плити призводить до опіку. Так ми вчимося не торкатися гарячих поверхонь.

У дитинстві ми продовжуємо розвивати свій здоровий глузд методом проб і помилок, спостерігаючи та спілкуючись із членами сім’ї. Наприклад, ми усвідомлюємо, що одяг потрібно прати регулярно, не можна розмовляти з повним ротом, а перекидання склянки молока призводить до безладу. Батьки, брати і сестри, вчителі та інші дорослі виправляють нас, коли ми порушуємо суспільні норми й очікування. Згодом ці уроки вкорінюються як основа здорового глузду.

Окрім особистого досвіду, здоровий глузд формується ширшими суспільними та культурними нормами. Те, що може бути здоровим глуздом в одній культурі (наприклад, зняття взуття при вході в дім), може не бути таким в іншій культурі.

Наш здоровий глузд адаптується в міру того, як ми дорослішаємо та контактуємо з більшою кількістю людей та середовища. Отже, дитина, яка росте в маленькому містечку, отримує елементарний здоровий глузд щодо життя в цьому оточенні. Доросла людина, яка переїжджає до великого мегаполісу, змушена пристосувати свій здоровий глузд до нового оточення.

Як редагувати повідомлення на iPhone, iPad і Mac

Здоровий глузд продовжує розвиватися, оскільки протягом життя ми отримуємо новий досвід.

Чому здоровий глузд є складним для комп’ютерів?

Є кілька причин, чому здоровий глузд важко запрограмувати.

З одного боку, люди поступово вчаться здоровому глузду протягом багатьох років пізнання світу. Ми пробуємо щось, дивимося, що працює, а що ні, і запам’ятовуємо уроки. Комп’ютери не мають такого досвіду реального світу, з якого можна було б почерпнути. Вони знають лише те, що їм чітко говорять люди.

Наприклад, я поставив ChatGPT (GPT 3.5) таке запитання:

Janet runs a laundry business. She washes clothes for customers and hangs them outside on clotheslines to dry in the sun. One day, Janet washed five shirts and hung them on the clotheslines in the morning. It took the shirts five hours to dry. How long will it take to dry 30 shirts?

З такою відповіддю виявилося:

Інша проблема полягає в тому, що здоровий глузд залежить від контексту. Якщо в комп’ютері запрограмовані лише певні правила, він не зможе адаптувати їх до нових контекстів так, як інтуїтивно зрозуміло люди.

Наприклад, ви навчили комп’ютер, що робити, якщо надворі почався дощ. Здається простим, чи не так? Але що тоді, якщо замість дощу вмикається спринклер? А що, якщо це в продуктовому магазині, і труби почнуть текти водою зі стелі? Ми миттєво знали б, як впоратися з цими варіаціями, але комп’ютер сліпо слідував би своєму правилу «під час дощу надворі, зайдіть всередину», що тепер не має сенсу.

Існують також негласні правила та припущення, які люди засвоюють, навіть не усвідомлюючи цього. Наприклад, наскільки близько ви можете стояти поруч з кимось, щоб це не відчуло себе ніяково? Люди інтуїтивно знають відповідь, але не можуть легко пояснити точні правила. Ці неявні соціальні норми можуть бути особливо складними для комп’ютерів, щоб підібрати їх лише з даних.

Отже, на даний момент здоровий глузд залишається однією з найбільших слабкостей ШІ порівняно з людським інтелектом. Це природно для людей, але не стільки для машин.

Як комп’ютери можуть навчитися здорового глузду

Після раннього оптимізму в 1970-х і 1980-х роках дослідники зрозуміли, наскільки важко буде навчити комп’ютер здорового глузду. Проте нові підходи є багатообіцяючими в навчанні систем ШІ мати базовий здоровий глузд щодо повсякденного фізичного та соціального світу.

Один із підходів полягає в створенні обширних баз знань вручну з детальним описом фактів і правил про те, як влаштований світ. Проект Cyc, започаткований у 1984 році Дугом Ленатом, є одним із амбітних зусиль такого роду.

10 найкращих інструментів відстеження помилок для сучасних команд розробників

Протягом десятиліть сотні логіків закодували мільйони логічних аксіом у Cyc. Незважаючи на витрати часу, результатом є система зі значними знаннями реального світу. Cyc, мабуть, може вважати, що помідор технічно є фруктом, але не повинен входити до фруктового салату, завдяки його знанням кулінарних смакових профілів.

Краудсорсинг здорового глузду з ConceptNet

Більш сучасні бази знань, як ConceptNet використовуйте підхід краудсорсингу, щоб створити твердження здорового глузду. Ідея полягає в тому, що замість того, щоб експерти чи штучний інтелект намагалися придумати всі основні факти та взаємозв’язки у світі, вони відкривають його, щоб будь-хто міг додати фрагменти здорового глузду.

Цей підхід краудсорсингу дозволяє цим базам знань підключатися до колективного розуму багатьох різних людей в Інтернеті. Накопичуючи тисячі й тисячі цих маленьких самородків здорового глузду з натовпу, ConceptNet створив кілька напрочуд великих сховищ базових повсякденних знань. І оскільки нові учасники завжди додають до нього, знання постійно зростають.

Навчання здоровому глузду через досвід

Інший багатообіцяючий підхід полягає в створенні детальних симуляцій світів, де агенти штучного інтелекту можуть експериментувати та вивчати фізику та інтуїцію на досвіді.

Дослідники створюють 3D-віртуальні середовища, наповнені повсякденними предметами, які імітують реальний світ, як-от цифровий дім «AI2 THOR», побудований Інститутом Аллена. У цих просторах роботи зі штучним інтелектом можуть випробувати всі види взаємодії, щоб розвинути інтуїтивне розуміння концепцій, які люди сприймають як належне.

Наприклад, боту зі штучним інтелектом можна надати віртуальне тіло, і він спробує підбирати блоки, складати їх, перекидати тощо. Бачачи, як блоки реалістично падають і стикаються, бот вивчає основні поняття про твердість, гравітацію та фізичну динаміку. Ніяких правил не потрібно — лише досвід.

Бот також може спробувати такі дії, як кинути скляний предмет і побачити, як він розбивається, коли вдаряється об землю. Або він може експериментувати з властивостями води, наливаючи рідини та спостерігаючи, як вони течуть і об’єднуються. Ці практичні уроки базують знання ШІ на сенсорному досвіді, а не лише на шаблонах даних.

Методи, що керуються даними, як-от попереднє навчання потужних великих мовних моделей, також виявилися напрочуд ефективними для визначення шаблонів здорового глузду. Такі моделі штучного інтелекту, як GPT-3.5 і GPT-4, можуть генерувати вражаюче людський текст після «прочитання» величезних обсягів Інтернет-даних.

Хоча вони іноді роблять нерозумні пропозиції (також відомі як галюцинації штучного інтелекту), підхід до статистичного навчання дозволяє їм імітувати певні форми здорового глузду. Проте залишається розбіжність щодо того, чи є це здоровим глуздом чи вмілим використанням упереджень у даних.

Як перевірити комп’ютери на здоровий глузд

Автор зображення: freepik/freepik

Оскільки системи штучного інтелекту беруться за складніші завдання реального світу, оцінка того, чи є у них «здоровий глузд», стає вирішальною.

6 найкращих програм для оптимізації відео [Free/Paid]

Здоровий фізичний глузд

Однією з сфер для перевірки є фізичний здоровий глузд — інтуїція щодо об’єктів, сил і основних властивостей світу.

Наприклад, покажіть системі комп’ютерного зору фотографію з книгою, що ширяє в повітрі, і попросіть її описати сцену. Чи помічає він щось незвичайне в плаваючій книзі? Або надайте системі штучного інтелекту незвичайні сценарії, як-от «чоловік нарізав камінь шматочком хліба», і перевірте, чи позначає вона їх як неймовірні.

Середовище AI2 THOR Інституту Аллена моделює блокові вежі, розлиті кухлі та інші сцени, щоб перевірити ці фізичні інтуїції.

Люди також мають соціальний здоровий глузд — неявне розуміння мотивації людей, стосунків і норм. Щоб оцінити це в ШІ, поставте ситуації з неоднозначними займенниками або мотиваціями та подивіться, чи система розумно їх інтерпретує.

Наприклад, я запитав у ChatGPT, чи йдеться «це» про валізу чи трофей у підказці нижче:

The trophy could not fit into the suitcase because it was too small.

Він провалив тест; тим часом людина, очевидно, дізнається, що я мав на увазі валізу.

Цей вид тесту називається Winograd Schema Challenge, спеціально орієнтований на соціальний здоровий глузд.

Безпека та етика

Важливо перевірити, чи засвоїли системи ШІ небезпечні або неетичні шаблони. Проаналізуйте, чи ШІ виявляє шкідливі упередження на основі статі, раси чи інших ознак, коли виносить судження.

Перевірте, чи він робить розумні етичні відмінності. Вбивство ведмедя заради порятунку дитини можна вважати виправданим, тоді як підрив ядерної бомби з тією ж метою – ні. Позначте будь-які рекомендації як явно неетичні дії.

Реальна продуктивність

Оцініть здоровий глузд, спостерігаючи за тим, як системи ШІ функціонують у реальних умовах. Наприклад, чи правильно безпілотні автомобілі розпізнають об’єкти та пішоходів і реагують на них? Чи може робот пересуватися різними домашніми умовами, не зламавши цінних предметів і не завдавши шкоди домашнім тваринам?

Тести в реальному світі виявляють прогалини в здоровому глузді, які можуть не проявлятися в обмежених лабораторних умовах.

Прогрес досягнуто, але робота над ШІ здорового глузду залишається

Деякі експерти стверджують, що штучний інтелект може ніколи не досягти людського здорового глузду без розвитку структур мозку та органів, подібних нашому. З іншого боку, цифровий розум не обмежений людськими упередженнями та розумовими ярликами, тож теоретично вони можуть перевершити нас! Хоча нам, ймовірно, поки що не варто турбуватися про надрозумний ШІ.

У найближчій перспективі найкращим варіантом є штучний інтелект, який поєднує набутий здоровий глузд із старомодним програмуванням. Таким чином, можна сподіватися уникнути таких дурних помилок, як помилка черепахи з гвинтівкою.

Ми ще не там, але здоровий глузд більше не є темною матерією штучного інтелекту – прогрес відбувається! І все ж певний час для застосування цих технологій знадобиться здорова доза людського здорового глузду.