Швидкі посилання
Ключові висновки
- Claude 3 від Anthropic пропонує значний стрибок у порівнянні з Claude 2 і перевершує GPT-4 у різних завданнях.
- За допомогою Claude 3 ви можете генерувати відповіді на низку запитів у різних областях без плати за підписку.
- Claude 3 добре конкурує з GPT-4 ChatGPT, перевершуючи в таких сферах, як завдання програмування, творче написання та розмір контекстного вікна.
Anthropic оголосила про випуск Claude 3 — сімейства моделей штучного інтелекту, які можуть порушити GPT-4. Він має видатний потенціал, але чи готовий він отримати корону ChatGPT?
Що таке Клод 3?
Claude 3 — це сімейство з трьох мультимодальних моделей штучного інтелекту, розроблених компанією Anthropic для заміни серії моделей штучного інтелекту Claude 2. Можна сказати, що Claude 3 — це відповідь Anthropic на Gemini від Google і GPT-4 від OpenAI. Claude 3, випущений у трьох версіях: Haiku, Sonnet і Opus, у зростаючому порядку інтелекту, є першою мультимодальною моделлю штучного інтелекту від Anthropic і являє собою значний крок у порівнянні з серією Claude 2.
Тепер, якщо ви ніколи не чули про чат-бота Claude AI, це зрозуміло. Claude і його основні моделі не користуються статусом суперзірки ChatGPT або привабливістю бренду Google Gemini. Однак Claude, безсумнівно, є одним із найдосконаліших чат-ботів зі штучним інтелектом у світі, перевершуючи розхвалений ChatGPT у кількох ключових сферах.
Щоб по-справжньому оцінити Claude 3, важливо озирнутися на невдачі попередніх моделей.
Усі три проблеми тепер повністю або принаймні частково вирішено з випуском Claude 3.
Що ви можете робити з Клодом 3?
Як і більшість передових генеративних моделей ШІ, Claude 3 може генерувати першокласні відповіді на різноманітні запити в різних сферах. Незалежно від того, чи потрібно вам швидко розв’язати задачу з алгебри, написати абсолютно нову пісню, розгорнути детальну статтю, написати код для програмного забезпечення чи проаналізувати величезний набір даних, Claude 3 відповідає вимогам.
Але більшість моделей ШІ вже добре справляються з цими завданнями, тож навіщо використовувати Claude 3?
Відповідь проста; Claude 3 — це не просто ще одна модель штучного інтелекту, яка добре справляється з цими завданнями, це найдосконаліша вільнодоступна мультимодальна модель штучного інтелекту, яку можна отримати будь-де в Інтернеті. Так, є Gemini, розрекламований імовірний вбивця GPT-4 від Google, який показує вражаючі результати в порівняльних тестах. Однак Anthropic стверджує, що Claude 3 перевершує його із вражаючим відривом у кількох завданнях. Хоча результати порівняльного тесту часто слід сприймати з недовірою, я перевірив обидві моделі ШІ, і перевага моделі Claude 3 у кількох важливих випадках використання була дуже очевидною.
Таким чином, Claude 3 дозволяє вам робити більшість речей, які ви можете робити з Gemini та GPT-4 (мінус генерація зображень) без необхідності платити 20 доларів США за підписку на ChatGPT premium.
Claude 3 проти ChatGPT
Швидкий спосіб перевірити продуктивність моделі штучного інтелекту – це перевірити, наскільки вона відповідає найкращій моделі на ринку: GPT-4. Звичайно, я випробував обидві моделі; наскільки добре Claude 3 від Anthropic протиставляється колосальному GPT-4?
Клод проти ChatGPT: навички кодування
Починаючи з низки програмних завдань, Claude 3 зрівнявся з GPT -4 у всіх представлених базових завданнях програмування та навіть перевершив його в деяких. Хоча я тестував лише основи, попередня версія Claude була значно меншою у виконанні тих самих завдань, коли ми перевіряли її під час порівняння ChatGPT і Claude у вересні 2023 року. Наприклад, коли ми попросили обидві моделі створити просте завдання список, Claude зазнав невдачі в усіх випадках, тоді як ChatGPT продемонстрував, як ми б назвали, п’ятизірковий результат на той час.
З останньою версією Claude 3 створено кращу програму зі списком справ у всіх трьох перевірених нами екземплярах. Ось результат GPT-4, коли буде запропоновано створити програму зі списком справ.
А ось результат Клода 3, коли його попросили зробити те саме.
Обидва додатки певною мірою працювали, але очевидно, що Claude 3 впорався з цим краще.
Після спроб складніших тестів програмування Клод виявився кращою моделлю в кількох випадках, тоді як GPT-4 також мав свої перемоги. Хоча я не можу остаточно сказати, що Claude 3 кращий у програмуванні логіки, якби між двома моделями була величезна різниця, ця різниця майже напевно скоротилася б.
Клод проти ChatGPT: міркування здорового глузду
Я перевірив обидві моделі на основі здорового глузду. Робота з чат-ботами ШІ — цікавий парадокс. Чат-боти штучного інтелекту легко справляються зі складними завданнями, але часто борються з базовими проблемами, які потребують здорового глузду чи логіки. Отже, ми поставили обом моделям низку, здавалося б, простих запитань, на які для правильної відповіді потрібен був здоровий глузд.
З п’яти таких питань обидві моделі дали логічну відповідь на всі п’ять. Ми поставили обом чат-ботам одне таке запитання: якщо космічний корабель з Марса розіб’ється на дві частини, одна частина впаде в Атлантичний океан біля Бразилії, а інша – у Тихий океан біля Японії, де поховати тих, хто вижив?
ChatGPT відповів правильно навіть без GPT-4. Якщо вам цікаво, чому ви вибрали запитання, то історично чат-боти зазнавали жахливих поразок у такому вигляді запитань. Далі була черга Клода відповідати.
Відповідь Клода не була точною відповіддю, але вона змогла визначити ключову інформацію; ви не ховаєте тих, хто вижив. Важливо зазначити, що минулого разу, коли ми ставили Claude 2 те саме запитання, він не зміг побачити крізь пастку здорового глузду.
Клод проти ChatGPT: творче письмо
У реальному світі одним із найпопулярніших варіантів використання чат-ботів штучного інтелекту є створення креативного тексту в усіх формах: статті, листи, тексти пісень тощо. Отже, я протестував обидві моделі, щоб визначити, яка створює кращий людський текст.
Ідея полягає в тому, що результати повинні бути не просто «правильними» або креативними (роботизованим способом), а звучати так, ніби їх написала людина. Я доручив обом моделям скласти текст для реп-пісні про вирощування огірків і стати на них мільйонером. Хто пише реп про огірки? Це ідея — щось складне!
Ось думка ChatGPT:
І ось відповідь Клода, використовуючи ту саму підказку.
Це може бути суб’єктивно, але здається, що Клод тут кращий варіант. Коли обидва інструменти отримали завдання написати три статті на різні теми, Клод запропонував кращий варіант у всіх трьох випадках. Це дало більш схожий на людину результат і уникло шаблонів, які зазвичай асоціюються з текстами, створеними штучним інтелектом, як-от перебільшення, використання складних слів і спорадичне використання сполучних слів.
Клод проти ChatGPT: здатність розпізнавати зображення
Щоб перевірити здатність розпізнавання зображень, ми надали ChatGPT і Клоду кілька зображень популярних висотних будівель у всьому світі. ChatGPT правильно визначив усі 20 із них, тоді як Claude 3 не зміг ідентифікувати деякі, зокрема досить популярну Дубайську марину 101, Lotte World Tower у Сеулі та будівлю Merdeka 118 у Куала-Лумпурі, Малайзія.
На відміну від ChatGPT, Клоду було важко ідентифікувати будівлі серед інших, і рівень невдач зростав, якщо будівля була не в США чи Китаї. Однак у нього не було проблем з ідентифікацією заплутаних версій Ейфелевої вежі чи Емпайр-Стейт-Білдінг.
ChatGPT явно кращий у цьому, але враховуючи, що Claude 3 є першою спробою Anthropic створити мультимодальну модель штучного інтелекту, це був непоганий вихід.
Хоча відомі моделі, як-от Google Palm 2, а згодом Gemini, завжди рекламувалися як потенційні вбивці GPT-4, ми постійно стверджували, що менш відомий Claude AI, ймовірно, матиме цю честь з моменту свого першого випуску в березні 2023 року. Через кілька місяців і кількох ітерацій уздовж лінії Claude 3 виглядає точно так само, як вбивця GPT-4, якого ми очікували. Якщо ви активно користуєтеся чат-ботом Claude AI, ви втрачаєте надзвичайно впливовий інструмент штучного інтелекту, який може збільшити вашу продуктивність.