ChatGPT-4 проти ChatGPT-3.5 за замовчуванням проти ChatGPT-3.5 Legacy: відмінності перевірено

Нова Ера Чат-ботів: ChatGPT 4.0 у Порівнянні з Попередніми Версіями

Вважається, що поява ChatGPT 4.0 здатна кардинально змінити світ чат-ботів. Але чи справді це оновлення настільки перевершує свого попередника? Давайте проведемо ретельний аналіз.

ChatGPT став першим кроком до майбутнього автоматизації, і такі гіганти, як Google та Microsoft, а також численні інші компанії, що спеціалізуються на штучному інтелекті, активно переймають цей досвід.

Спочатку було створено чимало чат-ботів, аналогічних ChatGPT, і багато з них не є розробками великих технологічних корпорацій.

Однак, завдяки ефективному маркетингу, ChatGPT залишається лідером серед усіх цих ШІ-ботів. Його можливості охоплюють широкий спектр завдань, включаючи математичні обчислення, написання поезії, створення публікацій для блогів, і навіть використання у судових справах.

Наприклад, DoNotPay розробляє інструмент на базі GPT-4 для автоматичної генерації позовів, що дозволяє подавати в суд на авторів автоматичних дзвінків та вимагати відшкодування в розмірі 1500 доларів США. Уявіть собі: ви отримуєте автоматичний дзвінок, натискаєте кнопку, дзвінок розшифровується, і автоматично створюється позов обсягом 1000 слів. GPT-3.5 не міг впоратися з цим завданням, але GPT-4 чудово з ним справляється:

— Джошуа Браудер (@jbrowder1) 14 березня 2023 р

Багато професіоналів висловлюють стурбованість щодо можливого знецінення їхніх навичок у найближчому майбутньому.

Проте, одна з публікацій на LinkedIn стверджує:

ШІ не замінить вас, але людина, яка використовує ШІ, цілком може це зробити.

Отже, давайте розглянемо останнє оновлення ChatGPT і з’ясуємо, чим воно відрізняється від попередніх версій.

ChatGPT: Стара Версія, Типова Версія та Оновлення

Користувачам, що мають платну підписку, доступні три версії: Legacy (3.5), Default (3.5) та новітнє оновлення ChatGPT (4).

Ось що OpenAI повідомляє про відмінності між ними:

Джерело: OpenAI

Безкоштовні користувачі можуть використовувати лише Legacy 3.5, тоді як преміум-підписка відкриває доступ до всіх трьох версій, щоб кожен міг випробувати їх та обрати для себе найкращу.

Підсумовуючи, платні плани пропонують точніші результати з високою швидкістю. Однак, відмінності проявляються особливо помітно, коли запити є складними та вимагають творчого підходу.

Параметр ChatGPT 4 ChatGPT 3.5
Результат іспиту Bar Exam Топ 10% Нижні 10%
AI2 Reasoning Challenge (ARC) 96,3% 85,2%
Python Coding Score 67% 48,1%
Візуальна інтерпретація Так Ні
Контекст Понад 25 тис. слів Менше

Джерело: OpenAI

Крім того, ChatGPT 4 може обробляти візуальні дані.

Досить теорії, перейдемо до практики і протестуємо ці версії в реальних умовах.

Подальші розділи містять зображення, які можуть здаватися нечіткими. У такому випадку, натисніть правою кнопкою миші на зображення та виберіть “Відкрити в новій вкладці” для правильного перегляду.

Математичні Завдання

Як інженер, я не міг не запропонувати їм декілька базових математичних задач. Почнемо з простих алгебраїчних рівнянь.

I етап

Багатьом з нас знайомі рівняння виду ax2+bx+c=0, де потрібно знайти значення x. Я надав таку підказку: “Розв’яжіть для x: x2 + x – 6 = 0″.

Усі версії надали правильні корені (X= -3,2), проте Legacy та Update безпосередньо застосували формулу (як зазвичай роблять студенти) для отримання результату.

У свою чергу, Default 3.5 надав два методи розв’язання, зокрема розкладання на множники, який часто використовують досвідчені учні при вирішенні таких простих рівнянь.

II етап

Наступним кроком було кубічне рівняння: x3 -12x2 + 48x – 64 = 0.

Саме тут ChatGPT 4 підтвердив своє звання “оновлення”.

Ось отримані результати:

Legacy та Default виявилися нездатними розв’язати загальне кубічне рівняння. Legacy зміг знайти два корені, тоді як Default не зміг впоратися з жодним.

Оновлена версія продемонструвала чудові результати, знайшовши всі три корені і надавши зрозуміле пояснення.

Логічні Завдання

Більшість елементарних математичних задач мають готові рішення. Якщо ви знаєте теорему чи формулу, вам достатньо підставити значення для отримання результату.

ChatGPT, будучи ШІ, може швидко обробляти такі запити. Проте, логічне мислення – це інша сфера, де ШІ може зазнати невдачі.

I етап

Я надав їм наступну задачу:

А старший за В.
C старший за A.
B старший за C.
Якщо перші два твердження вірні, то третє твердження вірне чи хибне?

Усі версії ChatGPT правильно визначили, що третє твердження є хибним.

Далі я використав імена замість літер, і результати вас здивують:

Default 3.5 показав результат нижче середнього та заплутався у цьому незначному варіанті. Legacy та Update, в свою чергу, показали оптимальні результати.

II етап

Метою етапів I та II є пошук відмінностей, де складність підказки виявляє перевагу оновлення над двома іншими версіями.

Я запропонував таку логічну загадку:

Одного ранку після сходу сонця Рохіт стояв обличчям до стовпа. Тінь від стовпа падала точно праворуч від нього. В який бік він дивився?
a. північ
b. захід
c. південь
d. схід

Legacy дав неточну відповідь, а Default надав розпливчасте пояснення, що призвело до неправильного висновку.

Лише Оновлення вказало правильну відповідь і надало зрозумілі пояснення.

Написання Листів

Подання позову до суду – складна справа, але іноді цього можна уникнути, якщо ви вмієте скласти переконливий перший лист.

Я дав таку підказку: “Напишіть листа Тіму Куку з проханням надіслати мені яблуко за те, що він не відповів на один із моїх твітів.”

Хоч і жартівлива, але подивимось, що ШІ зможе з цим зробити.

Legacy 3.5 сприйняв підказку як робот і створив лист, який, потрапивши до адресата, зробив би мене об’єктом глузувань.

Default також не показав себе з кращої сторони. Він відповів відмовкою, як сварлива стара людина, що говорить з п’ятирічною дитиною.

Хоча наведені аргументи були точними, це не сприяло створенню гарного листа.

Попри просту підказку, вона вимагала роздумів і творчості. І тут Оновлення показало себе:

По-перше, лист складено майже ідеально. По-друге, він позбавив мене необхідності шукати адресу штаб-квартири Apple в Google (хоча такі дані потрібно перевіряти).

По-третє, лист написаний у формальному, але водночас жартівливому стилі. Крім того, намір був зрозумілий з теми листа.

Лист передав почуття незадоволеного фаната Apple.

Отже, ChatGPT 4 (він же Оновлення) випереджає своїх попередників. Він надзвичайно розумний і має певне розуміння здорового глузду, що робить його не просто черговим чат-ботом.

Поезія

З появою ChatGPT я вважав, що поезія може стати його слабкою стороною.

Адже людині потрібні емоції, креативність і значні зусилля для створення чогось, що дійсно зачіпає читача.

Іншими словами, поезія – це мистецтво в чистому вигляді, і я таємно сподівався, що ШІ провалиться. Але це було до того, як мій колега нас сильно вразив у каналі Slack techukraine.net, створивши вірш з допомогою ChatGPT, ще до виходу оновлення 4.0.

I етап

Я надав кандидатам таку підказку: “Поетично висловіть, чому або чому не подача гамбургерів разом із їхнім поточним меню може принести користь мережі піцерій Domino’s. Обмежтеся 100 словами.”

Чи помітили ви різницю?

Версія Default написала дуже короткий вірш на 32 слова і не змогла використати весь потенціал, щоб продемонструвати свою креативність.

Legacy, хоч і використав найбільшу кількість слів з трьох версій, дійшов висновку, що додавання гамбургерів не є ризикованою справою та в будь-якому разі призведе до успіху, що не зовсім так.

Поезія Оновлення складалася лише з 53 слів, втративши майже половину виділеної кількості. Проте, були чітко виражені переваги та потенційні недоліки, що є більш гуманним підходом, ніж у інших версій.

II етап

Далі я попросив усіх “пояснити вірш п’ятирічній дитині”.

Цікаво, що Legacy не зміг зрозуміти контекст розмови і пояснив “Поезію” буквально. Default вловив контекст і стисло описав його в одному абзаці.

ChatGPT 4, продовживши цю тенденцію, спростив свою творчість, зберігши поетичний стиль.

ChatGPT Premium проти ChatGPT Free

Безкоштовна версія поступається платній за швидкістю та точністю, і не зрівняється з ChatGPT 4, але вона не є зовсім марною.

Щоб провести об’єктивне порівняння, я використав ті ж самі підказки, які ми використовували для тестування Legacy, Default та Update.

🔵 Математика: вона розв’язала квадратні рівняння, але дала неправильну відповідь на кубічні (як у Legacy та Default).

🔵 Логічне мислення: успішно пройшла перший етап з літерами та іменами, але не впоралася з другим (як у Legacy).

🔵 Листи: не написала лист і визнала підказку неетичною та недоречною (як у Default).

🔵 Поезія: створила вірш на 30+ слів і пристойно його пояснила (подібно до Default).

Отже, можна зробити висновок, що безкоштовна версія також непогана. Вона на рівні Default 3.5, а в деяких аспектах навіть краща.

Також читайте: Потужні підказки для покращення вашого досвіду ChatGPT

Перспективи на Майбутнє

Чутки про те, що ШІ замінить людську працю, не є повністю безпідставними.

Автоматизація спочатку зародилась у виробничій сфері, а тепер поширюється на інші області.

ШІ швидше розв’язує кубічні рівняння, створює вірші або пише листи, ніж я. Проте, він рідко відмовляється від підказок і майже не вчиться на своїх помилках, що є нашою перевагою.

Наголошую, штучний інтелект не замінить нас, але людина, яка використовує ШІ, цілком може це зробити.

У techukraine.net наша маркетингова команда використовує ChatGPT різними цікавими способами. Наприклад, нещодавно ми досягли 100 мільйонів переглядів, і наш генеральний директор вирішив віддячити аудиторії за допомогою розіграшу.

Маркетологам потрібна була назва, що привертала б увагу читачів. Тому вони дали підказку і попросили ChatGPT запропонувати кілька варіантів, як-от:

Крім того, ми використовуємо його для підсумовування контенту, перевірки граматики, пропозиції заголовків для нових статей тощо.

Є безліч способів скористатися перевагами та подолати стереотипи, що вважають ШІ непотрібним мотлохом.

Важливо пам’ятати, що завжди потрібна людина, яка оцінюватиме роботу ШІ, оскільки він може бути неточним і вводити в оману.

Оновлення — Це Дійсно Вражає!

За короткий час мого знайомства з ChatGPT 4, він показав себе більш креативним, зрозумілим і реалістичним. Проте, це машина, і вона може впевнено давати неправильні відповіді.

Але найбільше вражає рівень оновлення, який OpenAI розробила для цього проекту всього за декілька місяців.

Я з нетерпінням чекаю, чим нас здивує наступне оновлення!

P.S.: Не обмежуйтеся лише вікном чату; розширюйте його можливості за допомогою цих найкращих розширень ChatGPT Chrome. А чи замислювалися ви про інтеграцію ChatGPT із Siri?