Штучний інтелект Gemini від Google тут, але чи він кращий за ChatGPT?

Зміст

Модель Gemini від Google представлена трьома варіаціями: Ultra, Pro та Nano, кожна з яких розрахована на різні види завдань та рівні складності.
Gemini Ultra демонструє перспективні результати в ключових тестах штучного інтелекту, однак, станом на грудень 2023 року, не є загальнодоступною. Google анонсує її запуск у січні 2024 року.
Gemini Pro вже доступна для використання і, хоча демонструє хороші результати, наразі не може перевершити GPT-4.

Компанія Google постійно заявляла про перевагу своєї моделі Gemini AI над GPT-4 від OpenAI, на якій базується ChatGPT Plus. Тепер, з виходом Google Gemini, ми отримали можливість провести порівняльне тестування і оцінити, наскільки Gemini дійсно краща за GPT-4.

Коли Google представила Bard у березні 2023 року, це викликало великий оптимізм. Здавалося, що монополії OpenAI на ChatGPT прийде кінець і з’явиться гідний конкурент.

Проте, Bard так і не став тим гігантом штучного інтелекту, на якого чекали, і GPT-4 залишається лідером серед генеративних чат-ботів зі штучним інтелектом. Тепер Google випустила Gemini, але чи зможе ця довгоочікувана модель штучного інтелекту виявитися кращою за ChatGPT?

Що являє собою модель Google Gemini AI?

Gemini є найпотужнішою генеративною моделлю штучного інтелекту від Google. Її особливістю є здатність обробляти та взаємодіяти з різними типами даних, включаючи текст, аудіо, зображення та відео. Google прагне створити універсальну модель штучного інтелекту, яка б використовувала найсучасніші досягнення в цій сфері. Gemini буде доступна у трьох варіантах:

Gemini Ultra: найбільша та найпотужніша версія, призначена для виконання особливо складних завдань.
Gemini Pro: модель, розроблена для масштабування та забезпечення високої продуктивності для широкого спектру завдань, хоча вона і є менш потужною, ніж Ultra.
Gemini Nano: найбільш ефективна модель, оптимізована для використання на пристроях. Наприклад, розробники можуть застосовувати Gemini Nano для створення мобільних додатків або вбудованих систем, що дозволяє інтегрувати потужні можливості штучного інтелекту в мобільний простір.

У своєму офіційному блозі The Keyword, Google заявляє, що Gemini Ultra демонструє вищі результати, ніж інші передові моделі у декількох тестах. Компанія стверджує, що Gemini Ultra перевершує лідера галузі, GPT-4, у ряді ключових тестів.

З вражаючим результатом у 90,0% у складному тесті MMLU, Google заявляє, що Gemini Ultra є першою моделлю, яка продемонструвала продуктивність, що перевищує людський рівень у цьому багатогранному тесті, що включає 57 різних предметів.

Google

Gemini Ultra також має здатність розуміти, пояснювати та генерувати високоякісний код на багатьох популярних мовах програмування, таких як Go, JavaScript, Python, Java та C++. На папері це все виглядає дуже перспективно. Однак, ці результати є еталонними, а вони не завжди відображають повну картину. Тому, виникає питання, наскільки добре Gemini справляється з практичними завданнями?

Як використовувати Google Gemini AI

На даний момент, з усіх трьох варіантів моделі Gemini AI, ви можете почати використовувати Gemini Pro. Ця модель вже інтегрована в чат-бот Google Bard. Щоб скористатися Gemini Pro в Bard, зайдіть на сайт bard.google.com і авторизуйтеся, використовуючи свій обліковий запис Google.

Google заявляє про випуск Gemini Ultra у січні 2024 року, тому зараз нам доводиться обмежуватися тестуванням Gemini Pro у порівнянні з ChatGPT.

Порівняння Gemini з GPT-3.5 і GPT-4

При виході будь-якої нової моделі штучного інтелекту, її продуктивність оцінюється шляхом порівняння з моделями GPT від OpenAI, які на даний момент вважаються найпередовішими. Тому, використовуючи Bard та ChatGPT, ми перевірили здібності Gemini у математичних розрахунках, творчому написанні текстів, створенні коду, а також в точності обробки вхідних зображень.

Почавши з найпростішого математичного прикладу, ми попросили обидва чат-боти розв’язати: -1 x -1 x -1.

Bard спробував першим. Ми повторили запит двічі, але відповіді були невірними. Правильну відповідь ми отримали лише з третьої спроби, але це вже не враховується.

Далі ми спробували ChatGPT на базі GPT-3.5. З першої спроби він відповів правильно.

Для перевірки здатності Gemini інтерпретувати зображення, ми запропонували йому проаналізувати декілька популярних мемів. Він відмовився, зазначивши, що не може інтерпретувати зображення з людьми. ChatGPT, використовуючи GPT-4V, охоче погодився і зробив це бездоганно.

Ми спробували ще раз змусити його інтерпретувати зображення, одночасно перевіряючи його здатність розв’язувати проблеми та кодувати. Ми надали Bard, який використовує Gemini Pro, скріншот і попросили його проаналізувати зображення та написати HTML і CSS код для відтворення цього скріншоту.

Ось оригінальний скріншот.

Нижче наведено результат спроби Gemini Pro інтерпретувати та відтворити скріншот за допомогою HTML та CSS.

А ось спроба GPT-4 відтворити скріншот. Результат не дивний, враховуючи, що GPT-4 історично демонструє високу ефективність у кодуванні. Раніше ми вже показували, як GPT-4 може створити веб-додаток з нуля.

Ми попросили Gemini Pro створити вірш про Tesla (бренд електромобілів). Він показав незначні покращення у порівнянні з попередніми тестами, які ми проводили раніше. Ось результат:

На цьому етапі, ми вирішили, що порівняння з результатами GPT-3.5, а не з більш потужним GPT-4, було б більш доцільним. Тому, ми попросили ChatGPT з GPT-3.5 написати подібний вірш.

Можливо, це питання особистого вибору, але вірш від Gemini Pro здається дещо кращим. Однак, оцінювати вам.

Чи Gemini краще, ніж ChatGPT?

До запуску Bard від Google, ми вважали, що це буде той конкурент ChatGPT, на якого ми так довго чекали. Проте, цього не сталося. Тепер, з виходом Gemini, поки що Gemini Pro не є тією моделлю, яка зможе завдати нокаутуючого удару ChatGPT.

Google заявляє, що Gemini Ultra буде значно кращою. Ми сподіваємося, що це так, і що вона відповідатиме заявленим характеристикам. Однак, поки ми не зможемо побачити і протестувати найпотужнішу версію генеративного інструменту штучного інтелекту від Google, ми не дізнаємося, чи зможе вона перевершити інших конкурентів. На даний момент, GPT-4 залишається лідером серед моделей ШІ.