ChatGPT-4 проти ChatGPT-3.5 за замовчуванням проти ChatGPT-3.5 Legacy: відмінності перевірено

Очікується, що ChatGPT 4.0 спричинить велику хвилю у всесвіті чат-ботів. Але чи дійсно він перевершує свого попередника? Давайте перевіримо.

ChatGPT був лише верхівкою майбутнього айсберга автоматизації, а Google, Microsoft та багато інших компаній, що перш за все займаються штучним інтелектом, наслідували їхній приклад.

Для початку ми знайшли кілька чат-ботів, таких як ChatGPT, багато з яких не належать до великих технологій.

Але назвіть це силою маркетингу; ChatGPT досі є правлячим королем серед усіх таких ботів ШІ. Він може робити багато речей, включаючи математику, поезію та публікації в блогах, і люди навіть використовують це, щоб подавати позови.

DoNotPay працює над використанням GPT-4 для генерації «позовів одним клацанням миші», щоб подати до суду на авторів автоматичних дзвінків 1500 доларів США. Уявіть, що ви отримуєте дзвінок, натискаєте кнопку, дзвінок транскрибується та генерується позов із 1000 слів. GPT-3.5 був недостатньо хорошим, але GPT-4 чудово справляється із завданням: pic.twitter.com/gplf79kaqG

— Джошуа Браудер (@jbrowder1) 14 березня 2023 р

У ньому є безліч професіоналів, які хвилюються, що їхні навички стануть марними в найближчому майбутньому.

Однак я прочитав допис на Linkedin, у якому говорилося:

ШІ вас не замінить, але людина, яка використовує ШІ, може.

Отже, тримаємо кулаки, давайте дізнаємося про останнє оновлення ChatGPT і подивимося, чим воно відрізняється від попередніх версій.

ChatGPT: застаріла версія, типова версія та оновлення

Отже, платним користувачам доступні три версії: Legacy (3.5), Default (3.5) і нещодавнє оновлення ChatGPT (4).

Хоча ми трохи заглибимося в їхні можливості, ось що OpenAI має сказати про відмінності:

Джерело: OpenAI

Отже, хоча безкоштовні користувачі можуть грати лише з Legacy 3.5, преміум-підписка пропонує всі три, щоб спробувати й погодитись на те, що користувачі вважають найкращим.

Підсумовуючи попереднє зображення, платні плани призначені для отримання точніших результатів із пристойною швидкістю. Однак відмінності очевидні, лише якщо підказки складні та потребують творчості.

ПараметрChatGPT 4ChatGPT 3.5Bar Exam Score Верхні 10%Нижні 10%AI2 Reasoning Challenge (ARC)96,3%85,2%Python Coding Score67%48,1%Візуальна інтерпретаціяТакНі КонтекстПонад 25 тис. слівМеншеДжерело: OpenAI

Крім того, ChatGPT 4 може приймати візуальні дані.

Ну, досить хрестоматійних визначень. Давайте забруднимо руки та оцінимо цих кандидатів на полі бою в реальному житті.

Подальші розділи повні зображень, які можуть виглядати незрозумілими. У такому випадку клацніть будь-яке зображення правою кнопкою миші та виберіть «Відкрити в новій вкладці», щоб правильно переглянути.

Математика

Будучи дипломованим інженером, я не можу не закинути їм деякі основні проблеми. Почнемо легко з алгебраїчних рівнянь.

I стадія

Багато з нас бачили ці рівняння ax2+bx+c=0, де ми повинні розв’язати X. Тут я дав цю просту підказку Розв’язати для x: x2 + x – 6 = 0

  10 найкращих програм для пошуку магазинів, які допоможуть вашим клієнтам знайти вас

Хоча всі давали однакові корені (X= -3,2), Legacy та Update були більш схожими у використанні формули безпосередньо (як це зробить будь-який студент) для визначення результату.

Однак стандартний 3.5 пояснює два методи, включаючи розкладання на множники, які зазвичай застосовує будь-який досвідчений студент, коли йому даються такі звичайні рівняння.

II етап

Далі я пропоную йому розв’язати трохи складніше кубічне рівняння: x^3 -12x^2 + 48x – 64 = 0.

Це дійсно довело, чому ChatGPT 4 є «оновленням».

Ось відповіді:

Весь цей ажіотаж і ChatGPT Legacy і Default не змогли вирішити загальне кубічне рівняння. Однак Legacy впорався трохи краще і правильно знайшов два корені, тоді як Default не з усіма.

Оновлення стало безсумнівним переможцем на другому етапі та чудово розв’язало рівняння, знайшовши всі три корені з гарним поясненням.

Логічне міркування

Ми можемо з упевненістю припустити, що більшість елементарних математичних завдань мають словникові розв’язки. Якщо ви знаєте теорему або формулу, введіть значення та отримайте результати.

А ChatGPT, будучи ШІ, може швидко обробляти такі запити. Однак логічне мислення — це інша територія, з високою ймовірністю того, що штучний інтелект провалиться.

I стадія

Я дав їм класику:

А старше за В.
C старший за A.
B старше за C.
Третє твердження істинне чи хибне, якщо перші два твердження істинні?

І всі версії ChatGPT правильно стверджували, що третє твердження було хибним.

Далі я використав імена замість алфавіту, і результати можуть вас здивувати:

Таким чином, Default 3.5 продовжував працювати нижче номіналу і заплутався з цією скромною варіацією. Тим не менш, Legacy та Update працювали оптимально.

II етап

Можливо, ви вже помітили, що мета етапу I та етапу II полягає в тому, щоб знайти точку різниці, де складність заданого підказки відрізняє оновлення від двох інших.

Тут підказкою була проста логічна загадка:

Одного ранку після сходу сонця Рохіт стояв обличчям до стовпа. Тінь від стовпа впала точно праворуч від нього. У який бік він дивився?
a. північ
b. Захід
в. Південь
d. схід

Це підштовхнуло Legacy дати неточну відповідь, тоді як Default відповів нечіткими роз’ясненнями, що призвело до неправильного висновку.

Лише Оновлення сяяло правильною відповіддю з простими для виконання твердженнями.

Листи

Подати позов до суду може бути складно, але іноді до цього не приходить, якщо ви можете написати вражаюче перше повідомлення.

Я пішов із такою підказкою: напишіть листа Тіму Куку, щоб він передав мені яблуко за те, що я не відповів на один із моїх твітів.

Смішно, так! Але давайте подивимося, що ШІ може з цього зробити.

Legacy 3.5 миттєво сприйняв підказку, як робо-раб, і випустив лист, який може зробити мене чудовим об’єктом для насмішок, якщо він коли-небудь досягне призначення.

  До Mac OS X: що був NeXTSTEP і чому людям він сподобався?

За замовчуванням теж не було добре. Однак це мене просто закрило, як сварливий старий зробив би з п’ятирічним дитиною.

Незважаючи на те, що наведені аргументи були точними, це закінчилося веселощами прямо тут із невеликим навчанням.

Хоча це була досить проста підказка, вона потребувала трохи роздумів і креативності. І тут старший брат, Оновлення, висунув свою думку:

По-перше, це було складено майже ідеально. По-друге, це врятувало мене від пошуку в Google адреси штаб-квартири Apple (хоча такі записи потрібно перевіряти).

По-третє, це було гарно написано з офіційним тоном і гумористичним відтінком. Крім того, намір був зрозумілий у самій темі.

І все ж лист передав почуття незадоволеного фаната Apple.

Отже, це робить ChatGPT 4 (він же Оновлення) на милі попереду своїх старих родичів. Він неймовірно розумний і має деякі ознаки здорового глузду, що робить його більш ніж нудним чат-ботом.

Поезія

Із запуском ChatGPT поезія, на мою думку, може стати його слабкою стороною.

Зрештою, людині потрібні емоції, креативність і багато зусиль, щоб створити те, що по-справжньому резонує з читачем.

Простіше кажучи, поезія — це мистецтво в найкращому вигляді, і я таємно бажав, щоб ШІ зазнав невдачі. Але це було до того, як мій колега сильно вразив усіх нас у каналі Slack techukraine.net створенням ChatGPT, яке було створено до цього оновлення 4.0.

I стадія

Ось яку підказку я дав нашим кандидатам: «поетично висловіть, чому або чому не подача гамбургерів разом із їхнім поточним меню може принести користь мережі піцерій dominos. Нехай це буде менше 100 слів».

Ви можете помітити різницю?

Версія The Default була надкороткою, лише 32 слова, і не могла використати доступну пропускну здатність, щоб продемонструвати свою креативність.

The Legacy, незважаючи на те, що використано найбільше слів із трьох, робить висновок, що спроба подавати піцу поруч не є ризикованою та призведе до успіху в будь-якому випадку, що не зовсім так.

Поезія Оновлення складалася лише з 53 слів, втрачаючи майже половину відведеної кількості слів. Тим не менш, було зрозуміло винагороди та потенційні підводні камені та не вдалося досягти жодного результату, що, я вважаю, гуманніше, ніж решта.

II етап

Потім я попросив їх усіх «пояснити вірш п’ятирічній дитині».

Цікаво, що Legacy не зміг взяти контекст із розмови й пояснив «Поезію» буквально. За замовчуванням узяв контекст і резюмував його в абзаці, який все ще пристойний.

Продовжуючи цю тенденцію, ChatGPT 4 спростив свою творчість, зберігши при цьому поетичний колорит.

  Locationbar³ робить кожен сегмент в URL-адресі доступним для натискання [Firefox]

ChatGPT Premium проти ChatGPT Free

Будучи безкоштовним, йому не вистачає швидкості та точності, і він не зрівняється з ChatGPT 4, але він також не зовсім марний.

Щоб порівняти його на рівній основі, я кинув йому ті самі підказки, з якими ми тестували Legacy, Default і Update.

🔵 Математика: вона розв’язала квадратні рівняння, але дала неправильні відповіді для кубічного. (як у спадщині та за замовчуванням)

🔵 Логічне міркування: пройдено перший етап з алфавітами та іменами, але невдало з другим (як у Legacy).

🔵 Листи: не написав листа та вважав підказку неетичною та недоречною. (як за замовчуванням)

🔵 Поезія: створив поезію з 30+ слів і пристойно її пояснив. (подібно до параметра за замовчуванням).

Отже, ми можемо зробити висновок, що безкоштовна версія теж непогана. Насправді він нарівні з Default 3.5, а в деяких аспектах навіть кращий.

Читайте також: Потужні підказки для покращення вашого досвіду ChatGPT

Шлях вперед

Чутки про те, що штучний інтелект замінить роботу в майбутньому, не зовсім помилкові.

Спочатку автоматизація зробила це у обробній промисловості, а тепер вона розправляє крила всюди.

Особисто він швидше за мене розв’язує кубічні рівняння, створює вірші чи пише листи. Однак той факт, що він рідко каже НІ підказкам і майже не вчиться на своїх помилках, відстає від нас, людей.

Повторюю, штучний інтелект не замінить нас, але той, хто використовує штучний інтелект, може.

Тут, у techukraine.net, наша маркетингова команда використовує ChatGPT цікавими способами. Наприклад, нещодавно ми досягли 100 мільйонів переглядів, і наш генеральний директор вирішив повернути це аудиторії за допомогою розіграшу.

І я думаю, що маркетологам потрібна була назва, щоб привернути увагу читача. Отже, вони дали одне підказку та попросили ChatGPT запропонувати кілька варіантів, як-от:

Крім того, ми використовуємо його для підсумовування вмісту, перевірки граматики, пропозиції заголовків для нових статей тощо.

Зрештою, існує багато способів скористатися перевагами та подолати стереотипи, які вважають штучний інтелект непотрібним мотлохом.

Єдине, про що слід пам’ятати, що повинен бути хтось (людина), щоб оцінювати роботу ШІ, оскільки вона може бути (дуже) неточною та вводити в оману.

Оновлення — це справді щось!

Під час моєї короткої зустрічі ChatGPT 4 здався більш креативним, зрозумілим і реалістичним. Все-таки це машина і може впевнено давати неправильні відповіді.

Але що вражає, так це рівень оновлення, який OpenAI зробив для цього проекту всього за кілька місяців.

І я не можу дочекатися, щоб побачити магію, якою наступне оновлення може здивувати нас!

PS: не просто вікно чату; використовуйте його потужність за допомогою цих найкращих розширень ChatGPT Chrome. А ви коли-небудь думали про інтеграцію ChatGPT із Siri?