Швидкі посилання
Основні тези
- Claude 3 від Anthropic демонструє значний прогрес порівняно з Claude 2, а також перевершує GPT-4 у багатьох аспектах.
- Claude 3 надає можливість генерувати відповіді на різноманітні запити в різних галузях без необхідності оформлювати платну підписку.
- Claude 3 становить гідну конкуренцію GPT-4 ChatGPT, демонструючи вищі показники у таких напрямках, як кодування, креативне письмо та обробка великих контекстних вікон.
Компанія Anthropic представила Claude 3 – нове сімейство моделей штучного інтелекту, здатне змінити конкурентне середовище, де домінує GPT-4. Чи зможе він потіснити ChatGPT та здобути лідерство на ринку?
Що являє собою Claude 3?
Claude 3 – це родина з трьох мультимодальних моделей ШІ, розроблених Anthropic на заміну попередній серії Claude 2. Claude 3 можна вважати відповіддю Anthropic на Gemini від Google та GPT-4 від OpenAI. Випущений у трьох варіантах: Haiku, Sonnet і Opus (від найменшого до найвищого рівня інтелекту), Claude 3 є першою мультимодальною моделлю ШІ від Anthropic, що знаменує значний прогрес у порівнянні з Claude 2.
Якщо ви раніше не чули про чат-бота Claude AI, це цілком зрозуміло. Claude та його ключові моделі не мають такої популярності, як ChatGPT, або привабливості бренду Google Gemini. Однак, безперечно, Claude є одним з найсучасніших чат-ботів ШІ, перевершуючи визнаний ChatGPT у кількох важливих аспектах.
Для повної оцінки можливостей Claude 3 варто згадати недоліки попередніх моделей.
- Попередні версії Claude відзначалися надмірною обережністю у питаннях безпеки ШІ. Функції безпеки Claude 2 були настільки строгими, що чат-бот уникав багатьох тем, навіть тих, де не було явних проблем із безпекою.
- Існували також проблеми з розміром контекстного вікна моделі. Якщо ви просите ШІ пояснити щось або зробити стислий виклад довгої статті, уявіть, що він може “прочитати” лише кілька абзаців одночасно. Обмеження на кількість тексту, з якою він може працювати одночасно, називається “контекстним вікном”. Попередні версії Claude мали контекстне вікно на 200 тисяч токенів (приблизно 150 000 слів). Проте, модель не могла ефективно обробляти таку кількість тексту, запам’ятовуючи не всі деталі.
- Також поставало питання мультимодальності. Майже всі основні моделі ШІ стали мультимодальними, тобто вони здатні обробляти різні типи даних, наприклад, зображення, та реагувати на них (а не тільки на текст). Claude цієї можливості не мав.
З виходом Claude 3 усі ці три проблеми вирішено повністю або частково.
Можливості Claude 3: що він вміє?
Як і більшість передових генеративних моделей ШІ, Claude 3 може створювати високоякісні відповіді на різноманітні запити в різних областях. Незалежно від того, чи потрібно вам швидко вирішити математичну задачу, написати нову пісню, створити докладну статтю, написати програмний код або проаналізувати великий масив даних, Claude 3 здатний на це.
Проте, більшість моделей ШІ вже добре справляються з цими завданнями, тож чому варто обрати Claude 3?
Відповідь проста: Claude 3 – це не просто чергова модель ШІ, що добре виконує ці завдання, а найсучасніша вільнодоступна мультимодальна модель ШІ, яку можна знайти в інтернеті. Так, існує Gemini – широко розрекламований “вбивця GPT-4” від Google, що показує вражаючі результати в порівняльних тестах. Однак, Anthropic стверджує, що Claude 3 перевершує його в багатьох завданнях. Хоча результати порівняльних тестів часто потрібно сприймати критично, я особисто протестував обидві моделі ШІ, і перевага Claude 3 у кількох ключових сценаріях використання є очевидною.
Отже, Claude 3 дозволяє робити майже все те ж саме, що і Gemini та GPT-4 (за винятком генерації зображень), без необхідності платити за підписку ChatGPT premium.
Claude 3 проти ChatGPT
Швидкий спосіб оцінити ефективність моделі ШІ – це порівняти її з лідером ринку: GPT-4. Звісно, я протестував обидві моделі, щоб з’ясувати, наскільки Claude 3 від Anthropic може протистояти потужному GPT-4.
Claude проти ChatGPT: навички кодування
Починаючи з низки програмних задач, Claude 3 зрівнявся з GPT-4 в усіх запропонованих базових завданнях з програмування і навіть перевершив його в деяких. Хоча я перевіряв лише базові завдання, попередня версія Claude 2 значно гірше справлялася з ними, коли ми тестували її під час порівняння ChatGPT та Claude у вересні 2023 року. Наприклад, коли ми попросили обидві моделі створити просте завдання зі списком справ, Claude 2 провалився, в той час як ChatGPT продемонстрував відмінний результат.
У новій версії Claude 3 створив кращу програму зі списком справ у всіх трьох випадках, які ми тестували. Ось приклад результату GPT-4 на запит створити програму зі списком справ.
А ось результат Claude 3 на той самий запит.
Обидві програми працювали, але очевидно, що Claude 3 впорався із завданням краще.
Зі складнішими тестами програмування Claude проявив себе краще у деяких випадках, тоді як GPT-4 теж мав свої перемоги. Хоча я не можу остаточно стверджувати, що Claude 3 є кращим у програмуванні, якби між моделями була значна різниця, то вона б майже напевно скоротилася.
Claude проти ChatGPT: міркування здоровим глуздом
Я перевірив обидві моделі на здатність до міркування зі здоровим глуздом. Робота з чат-ботами ШІ – це цікавий парадокс. Чат-боти ШІ легко справляються зі складними завданнями, але часто мають проблеми з простими, що вимагають здорового глузду та логіки. Тому, ми поставили обом моделям низку на перший погляд простих запитань, які для правильної відповіді вимагали здорового глузду.
З п’яти таких запитань, обидві моделі дали правильні відповіді на всі п’ять. Одне з запитань було таким: якщо космічний корабель з Марса розіб’ється на дві частини, одна з яких впаде в Атлантичний океан біля Бразилії, а інша – в Тихий океан біля Японії, де поховати тих, хто вижив?
ChatGPT дав правильну відповідь навіть без GPT-4. Якщо вам цікаво, чому ми обрали саме це питання, то раніше чат-боти катастрофічно провалювалися на подібних запитаннях. Далі була черга Claude 3.
Відповідь Claude не була ідеальною, але вона змогла визначити ключову інформацію: “виживших не ховають”. Варто відзначити, що минулого разу, коли ми ставили таке запитання Claude 2, він не зміг обійти пастку здорового глузду.
Claude проти ChatGPT: креативне письмо
В реальному світі одним із найпопулярніших варіантів використання чат-ботів є створення креативного тексту у різних формах: статті, листи, тексти пісень тощо. Тому я протестував обидві моделі, щоб визначити, яка з них генерує більш якісний текст, наближений до людського.
Ідея полягає в тому, що результати мають бути не просто “правильними” чи креативними (у роботозований спосіб), а мають звучати так, ніби їх написала людина. Я попросив обидві моделі створити текст для реп-пісні про вирощування огірків і досягнення мільйонного статку завдяки цьому. Хто ж пише реп про огірки? У цьому і полягала складність!
Ось, що запропонував ChatGPT:
А ось відповідь Claude 3 на той самий запит:
Це може бути суб’єктивно, але Claude 3 тут виглядає краще. Коли обидві моделі отримали завдання написати три статті на різні теми, Claude 3 надав якісніший результат у всіх трьох випадках. Він надав більш “людяний” текст і уникав шаблонів, які зазвичай асоціюються з текстами, згенерованими ШІ, як-от перебільшення, використання складних слів і надмірна кількість сполучних слів.
Claude проти ChatGPT: здатність розпізнавання зображень
Для перевірки можливості розпізнавання зображень, ми надали ChatGPT та Claude 3 кілька зображень популярних висотних будівель з усього світу. ChatGPT правильно розпізнав усі 20 будівель, тоді як Claude 3 не ідентифікував деякі, зокрема, доволі популярну Дубайську Марину 101, Lotte World Tower в Сеулі та будівлю Merdeka 118 в Куала-Лумпурі, Малайзія.
На відміну від ChatGPT, Claude 3 мав проблеми з ідентифікацією будівель (особливо, якщо вони не були розташовані в США або Китаї). Проте, він без проблем ідентифікував відомі версії Ейфелевої вежі та Емпайр-Стейт-Білдінг.
ChatGPT явно кращий у цьому, але враховуючи, що Claude 3 є першою спробою Anthropic створити мультимодальну модель ШІ, це є непоганим результатом.
Хоча відомі моделі, як-от Google Palm 2, а згодом Gemini, завжди рекламувалися як потенційні “вбивці” GPT-4, ми завжди стверджували, що менш відомий Claude AI, ймовірно, матиме цю честь з моменту свого першого випуску в березні 2023 року. Після кількох місяців і кількох ітерацій, Claude 3 виглядає саме тим “вбивцею” GPT-4, якого ми очікували. Якщо ви ще не користуєтеся чат-ботом Claude AI, то втрачаєте надзвичайно потужний інструмент ШІ, що здатний збільшити вашу продуктивність.