Що таке GPTZero? Як використовувати його для виявлення тексту, створеного ШІ

Зміст

Основні моменти

GPTZero – це інструмент для ідентифікації текстів, створених штучним інтелектом, розроблений для допомоги викладачам у відрізненні оригінальних робіт від тих, що згенеровані ШІ, шляхом аналізу складності та неоднорідності тексту.
GPTZero пропонує як безкоштовні, так і платні варіанти, кожен з яких має різні можливості та ліміти, надаючи користувачам змогу обробляти від кількох тисяч до мільйонів слів на місяць.
Попри прагнення GPTZero мінімізувати помилкові виявлення, викладачам рекомендовано використовувати його результати з обережністю та не покладатися на них як на єдине джерело оцінювання, щоб запобігти упередженим судженням.

З появою ChatGPT від OpenAI, освітні заклади по всьому світу зіткнулися з викликом, оскільки студенти почали використовувати його для написання есе та обходу оцінювань. Завдяки реалістичності тексту, згенерованого чат-ботом, викладачам стало складніше розрізняти оригінальні роботи студентів.

Для допомоги викладачам в оцінюванні студентських робіт, випускник факультету інформатики створив GPTZero, інструмент для перевірки ШІ, який визначає, чи текст був згенерований штучно.

Хоча це звучить перспективно, виникає питання: чи дійсно GPTZero здатний виявляти контент, створений ШІ, і наскільки точними є його результати?

Що таке GPTZero та як він працює?

GPTZero – це аналітичний інструмент на основі штучного інтелекту, розроблений Едвардом Тіаном, для допомоги викладачам у розрізненні плагіату від справжніх робіт. Інструмент аналізує текст на предмет складності та розривів, щоб встановити, чи він був згенерований ШІ, чи написаний людиною.

Без заглиблення в технічні деталі, давайте розберемо значення цих термінів:

Складність вимірює випадковість тексту в контексті обробки природної мови (NLP). Текст, створений людиною, зазвичай є менш структурованим та більш непередбачуваним, що відображається у вищих показниках складності. На противагу цьому, текст, створений ШІ, повинен мати нижчий рівень складності.
Розрив враховує інші аспекти, не враховані першим аналізом, для глибшого дослідження тексту. Він виявляє незвичайні елементи у випадкових групах. Текст, згенерований ШІ, зазвичай має більш послідовну структуру, ніж той, що написаний людиною. Розрив допомагає це виявити.

GPTZero Classic, доступний з початку 2023 року, є безкоштовним для використання. Однак, безкоштовна версія має обмеження в 5000 символів на документ, та дозволяє обробляти лише три документи одночасно.

GPTZero пропонує три платні версії для користувачів, що потребують аналізу великих обсягів тексту: Essential (10 доларів на місяць), Premium (16 доларів на місяць) та Professional (23 долари на місяць). Платні версії мають вищі обмеження на кількість символів в документі та дозволяють здійснювати більше перевірок за годину, серед інших переваг.

Для підписки на платні версії необхідно:

Перейти на веб-сайт GPTZero.

У верхньому правому куті сторінки натиснути на вкладку “Інформаційна панель”.

Увійти, використовуючи вже існуючий акаунт, або створити новий.

Після входу, можна порівняти доступні плани та обрати той, що найкраще відповідає вашим потребам.

Також, на головній сторінці GPTZero, можна натиснути кнопку “Оновити” внизу текстового поля, щоб переглянути та придбати платний тариф.

Як використовувати GPTZero для виявлення тексту, згенерованого ШІ

На відміну від ChatGPT, для використання GPTZero реєстрація не потрібна. Доступ до інструменту можна отримати через веб-сайт.

Перейдіть на GPTZero.

Скопіюйте та вставте текст для аналізу в поле, або завантажте файл.

Натисніть кнопку “Перевірити походження”.

Після завершення аналізу, GPTZero покаже, чи текст був написаний людиною, чи згенерований ШІ.

Як використовувати розширення Origin від GPTZero для виявлення тексту, згенерованого ШІ

Встановивши безкоштовне розширення Origin від GPTZero у браузер Chrome, можна сканувати веб-сторінки та документи Google на предмет тексту, згенерованого ШІ. Ця функція спрощує процес перевірки контенту в інтернеті.

Перейдіть на сторінку розширення Origin у веб-магазині Chrome.

Натисніть “Додати до Chrome”, щоб встановити розширення.

Далі підтвердіть встановлення для продовження.

Після встановлення, увійдіть за допомогою вашого облікового запису Google, або створіть новий.

Для сканування веб-сторінки чи документу Google, натисніть кнопку “Походження” на екрані та виберіть “Сканувати всю сторінку”.

Після сканування ви зможете переглянути результати та визначити, чи текст написаний людиною, чи згенерований ШІ.

Використання GPTZero для аналізу власного письма

Однією з переваг GPTZero над іншими інструментами виявлення ШІ є можливість аналізу ваших індивідуальних стилів письма. Платформа зберігає історію сканувань, де можна переглянути будь-який проаналізований текст.

Натиснувши на певний результат, ви отримаєте більш детальну інформацію про текст. Це дозволяє зрозуміти, чому ваш текст був розцінений як написаний людиною, або згенерований ШІ.

Наприклад, якщо GPTZero визначив, що ваш текст був створений штучним інтелектом, у розділі “Аналіз письма” ви побачите причини: низький рівень складності та високу однорідність. Використовуючи цю інформацію, ви можете покращити якість, читабельність та автентичність вашого тексту.

Чи може GPTZero правильно розпізнавати текст, створений ШІ?

Для перевірки точності GPTZero у виявленні тексту, згенерованого ШІ, ми проаналізуємо три різних тексти: текст, створений ШІ, текст, написаний людиною, та текст, створений ШІ, але перефразований іншим інструментом. Розглянемо, як GPTZero відреагує на кожен з них.

1. Аналіз тексту, згенерованого ШІ, у GPTZero

Для аналізу тексту, створеного ШІ, спершу згенеруємо його за допомогою ChatGPT, чат-бота на основі технології GPT. Для цього виконайте наступні кроки:

Перейдіть на сайт OpenAI.

Натисніть кнопку “Спробувати ChatGPT”.

Увійдіть або зареєструйтеся, щоб створити акаунт.

Введіть будь-який запит для генерації тексту.

Скопіюйте згенерований текст.

Проаналізуйте його в GPTZero.

Після проведення цього тесту, GPTZero показав неоднозначні результати з різними текстами, написаними ШІ. Іноді він не міг визначити, що текст був згенерований, а іноді правильно розпізнавав більшу його частину як згенеровану ШІ.

Для генерації тексту можна використовувати й інші інструменти ШІ.

2. Аналіз перефразованого тексту, згенерованого ШІ, в GPTZero

Існує безліч інструментів для перефразування тексту. У цьому випадку ми використали Scribbr. Якщо ви хочете скористатися тим самим інструментом, виконайте наступні кроки:

Перейдіть на сайт Scribbr.

Скопіюйте згенерований ШІ текст, який ми аналізували раніше в GPTZero, та вставте його в інструмент.

Натисніть кнопку “Перефразувати”.

Дозвольте Scribbr перефразувати текст.

Проведіть повторний тест в GPTZero.

Ми виявили, що незначне перефразування дещо ускладнило GPTZero визначення того, чи був текст згенерований ШІ, але загалом результати були неоднозначними. Додам, що якість перефразованого тексту була досить низькою. Оригінальний текст зліва, перефразований – справа.

3. Аналіз тексту, написаного людиною, в GPTZero

Іноді інструменти, як GPTZero, дають хибні позитивні результати, тобто помилково вважають правильний текст невірним. Для визначення, чи GPTZero також дає хибні спрацьовування, ми провели кілька тестів, аналізуючи різні тексти, написані людьми.

Результати GPTZero були здебільшого точними, хоча він визначив одне речення як потенційно написане ШІ.

Чи варто довіряти результатам GPTZero?

На підставі проведених тестів, покладатися виключно на результати цього інструменту може бути ризиковано. Фактично, кожен раз при отриманні результатів з’являється попередження для викладачів щодо неможливості повної довіри до результатів інструменту.

Якщо навіть розробник інструменту не гарантує надійність результатів, викладачам не варто повністю на нього покладатися. Чому? Тому що, студент може несправедливо отримати низьку оцінку через помилковий результат GPTZero.

Зусилля GPTZero для мінімізації хибних спрацьовувань

Попри виклики, GPTZero досяг значного прогресу в зменшенні хибних спрацьовувань. Впровадження нової моделі глибокого навчання сприяло цьому процесу, зробивши інструмент виявлення ШІ надійнішим, порівняно з конкурентами.

Нова модель глибокого навчання використовує більш різноманітний набір даних для перевірки, включаючи навчальні тексти, газетні статті, публікації в соціальних мережах, та контент з розділів “питання-відповідь”. Цей широкий спектр даних дозволяє GPTZero краще розрізняти текст, створений людиною, від згенерованого ШІ. Також компанія заявляє, що прогнози GPTZero стали більш «впевненими», ніж раніше.

Не завжди довіряйте результатам виявлення ШІ

GPTZero має великий потенціал як потенційна протидія технології GPT OpenAI, але попереду ще довгий шлях. Наразі він не є цілком надійним. Чи зможе основна версія GPTZero подолати всі обмеження та точно виявляти контент ШІ? Час покаже.