Повний посібник із виявлення плагіату чат-бота AI

ШІ-чат-боти, такі як ChatGPT, не обмежуються лише відповідями на ваші запитання. Вони можуть писати електронні листи, супровідні листи, есе, вірші, дописи в блогах і багато іншого.

Написання штучним інтелектом схоже на хамелеона – воно настільки добре поєднується з будь-яким іншим типом письма, що вам буде важко помітити різницю.

На жаль, через це нам, людям, надзвичайно важко виявити, коли штучний інтелект написав щось замість людини. Звичайно, ми всі могли б скористатися порадою Шерлока Холмса і «усунути неможливе», але в кого є на це час?

Що, якщо я скажу вам, що наведений вище параграф написаний ШІ? Так, я попросив YouWrite написати короткий вступ до цієї публікації, що й вийшло. Досить переконливо, правда? Ось у чому проблема, це занадто переконливо, що будь-хто може представити це як власну роботу, щоб мати з цього користь.

ШІ не просто перефразовують вміст; вони вивчають тему та представляють її природною мовою за допомогою RLHF. Це означає, що створений вміст не буде ні читатися роботом, ні його можна буде порівняти з даними, доступними в Інтернеті, щоб виявити плагіат.

Вловити створений штучним інтелектом контент непросто, і я не збираюся давати вам помилкову надію, що ви зможете вловити його зі 100% точністю. Однак за допомогою детективної роботи та допомоги інструментів розпізнавання тексту штучного інтелекту можна вловити більшість творів ШІ.

Нижче ви знайдете ручні способи виявлення плагіату ШІ та деякі автоматичні інструменти.

Вручну виявляйте плагіат ШІ 🕵️

ChatGPT навіть не є великою проблемою, коли йдеться про плагіат ШІ. Існує багато альтернативних інструментів, які базуються на тій же технології GPT-3 і створені для запису. Вони дуже вдосконалені та створені спеціально для створення людського вмісту, який важко вловити.

Залежно від типу вмісту, довжини та складності інструменти автоматичного виявлення можуть бути незначними. Тож, принаймні наразі, найкращим способом з’єднати крапки вручну, щоб з’ясувати, створено запис штучним інтелектом чи ні.

Нижче я перерахував деякі загальні підказки, які ви можете знайти, щоб зловити контент, створений ШІ.

#1. Застаріла інформація

Наприкінці 2021 року ChatGPT та інший штучний інтелект на основі GPT-3 скоротили свої знання. Незважаючи на те, що деякі боти ШІ мають вбудовану пошукову систему для пошуку найновішої інформації, вони все ще покладаються на старі дані для написання довгострокового вмісту, як-от есе або дописи в блогах.

Якщо ви помітили, що в статті постійно йдеться про застарілі дані, особливо до 2021 року, це може бути створено ШІ.

На скріншоті нижче я попросив YouWrite розповісти мені про нещодавній Чемпіонат світу з футболу, і ось що вийшло.

8 найкращих API для створення відео та зображень для соціальних мереж, електронної комерції тощо!

У ньому йдеться про чемпіонат світу 2018 року замість недавнього 2022 року. Незважаючи на те, що інструмент оновлено, щоб розповідати про нещодавні події, як-от Чемпіонат світу з футболу 2022 року, для написання довгих дописів він усе ще використовує застарілі дані, на яких побудовано.

#2. Використовує ту саму структуру речень для описів

Під час написання описів кількох продуктів/додатків ШІ зазвичай використовує ту саму структуру речень, яку редагує відповідно до опису продукту. Описи зазвичай починаються з одного слова, наприклад The, It, A або назви продукту. Описи також мають спеціальний фокус, який повторюється.

Наприклад, нижче я попросив ChatGPT розповісти мені про «веб-сайти для роботи з введенням даних». Ви бачите, що всі описи починаються з букви «A» і мають суворий фокус.

Я також поставив YouChat те саме запитання, і він зробив те саме й повторив назву кожного веб-сайту на початку, а самі описи виглядають як перефразована версія кожного.

Якщо запис, який ви аналізуєте, містить опис чогось подібного за своєю природою, це чудовий спосіб вловити написання ШІ.

#3. Використовує короткі речення

Для більшості записів ШІ використовуватиме однострокові речення щонайбільше з однією комою. Можливо, вони намагаються мінімізувати ймовірність помилки, але вони уникають написання довгих речень, які можуть вимагати використання двокрапки, крапки з комою або щільних горизонтальних ліній.

Я знаю, що це не найкраща підказка для виявлення ШІ, але варто подумати, щоб додатково підтвердити свою підозру.

#4. Може надати неправдиву інформацію

Для складних запитань, які зазвичай передбачають певні інструкції, ШІ може не зрозуміти намір і надати невірну інформацію. Я не говорю про застарілу інформацію, просто вони впевнено повідомляють вам неправильну інформацію, коли вони не розуміють тему.

Наприклад, я попросив YouWrite розповісти мені, «як рутувати телефон Android без ПК». Він все ще показував мені методи, які включають використання ПК на певному етапі навчання.

#5. Не додає особистої думки

Говорячи про щось, ШІ говорить лише про відомі факти. На відміну від людей, він не розповідатиме про свій особистий досвід роботи з ним. Хоча штучному інтелекту можна доручити створити практичний опис, вони, як правило, уникають цього за замовчуванням.

Якщо ви помітили, що в статті йдеться лише про добре відомі факти, велика ймовірність, що її написав штучний інтелект. Наприклад, коли йдеться про програму, вона буде говорити про її функції, а не про те, наскільки гладка навігація чи як насправді використовувати програму.

#6. Короткі пояснення

Оскільки штучний інтелект обмежений наявними знаннями, вони прагнуть писати короткі пояснення та описи. З мого досвіду, якщо вони говорять про конкретну тему, наприклад про рутування Android, вони тримають пояснення максимум у 2-3 абзацах. А для таких речей, як програми чи продукти, опис зазвичай не перевищує 1 абзацу.

Як виправити, що гумка GIMP не працює

Люди можуть докладно писати про щось, зокрема особливості, обмеження, особистий досвід, ціни тощо. З іншого боку, штучний інтелект зазвичай зосереджується на основних функціях або акцентах, тому опис також короткий. Якщо інструктор просить детальніше, ймовірність невірної інформації значно зростає.

#7. Перевірте історію письменника

Як викладач або веб-майстер, якщо ви маєте доступ до попередніх робіт або завдань письменника, було б гарною ідеєю порівняти їх із записом, який викликає у вас підозру. Дуже малоймовірно, що стиль написання письменника подібний до ШІ. Незважаючи на те, що штучний інтелект може змінювати тон написання, він вибирає досить загальні стилі, і він не може скопіювати ваш тон.

Візьмемо приклад абзацу, згенерованого штучним інтелектом, у вступі до цієї публікації. Будь-хто, хто читав мої попередні пости, може легко побачити, що мій стиль написання зовсім інший у порівнянні з ним.

Ви можете просто прочитати 2-3 попередні твори письменника і перевірити, чи відповідає він стилю написання підозрілого запису.

Інструменти для виявлення плагіату ШІ

Існує безліч доступних інструментів, які можуть виявляти вміст, написаний ШІ. Однак їхня точність відрізняється один від одного і може бути невдалою залежно від типу вмісту та довжини.

Я протестував ці інструменти, використовуючи різні типи вмісту, створеного ChatGPT, GPT-3 Playground, WriteSonic, Rytr і YouWrite. Їм вдалося виявити всі типи контенту, створеного ChatGPT і GPT-3 Playground.

Хоча вони отримали змішані результати для спеціальних інструментів для написання, цікаво, що всі вони не змогли виявити YouWrite, я припускаю, що це тому, що YouWrite робить людські помилки з метою уникнути виявлення.

Я рекомендую вам використовувати ці інструменти разом із перевіркою вмісту вручну. Спочатку проаналізуйте вміст за допомогою одного з цих інструментів, а потім вручну перевірте наявність підказок, щоб підтвердити підозру.

Нижче я перелічую ті, які запропонували найкращі результати та є найпростішими у використанні:

Примітка: для демонстрації я збираюся використовувати згенерований текст WriteSonic про «Переваги манго».

#1. Вміст у масштабі

Я вважаю, що детектор вмісту штучного інтелекту від Content At Scale був найточнішим для більшості тестів, які я проводив. Він дозволяє сканувати до 2500 символів за сканування та робить прогноз у відсотках, що показує реальну чи підроблену щільність вмісту.

Можна з упевненістю припустити, що вміст, який на 60% становить підробку, написаний вмістом AI, принаймні більша його частина. На скріншоті нижче ви можете побачити, що 96% вмісту є фейковим, і я повністю створив його за допомогою ШІ.

Бамбуковий папір нарешті став мультиплатформенним, і ми спробували це зробити

#2. GPTZero

Якщо ви хочете побачити, який саме контент створює ШІ, то GPTZero — це хороший варіант. GPTZero не оцінює вміст. Замість цього він висвітлює точний вміст, який, ймовірно, створено ШІ.

Незважаючи на те, що він показує оцінки заплутаності та розриву, щоб отримати уявлення про випадковість у тексті, що важливіше, він підтримує 5000 символів за сканування, а також може завантажувати файли. Сканування великого вмісту значно підвищує точність.

#3. Вихідний детектор GPT-2

Творці ChatGPT також пропонують бота для виявлення власної роботи. Оскільки GPT-2 і GPT-3 відрізняються лише загальними даними, які використовуються для навчання, цей детектор GPT-2 також добре працює для ШІ на основі GPT-3.

Немає обмежень на кількість вмісту, який він може сканувати, тому він ідеально підходить для виявлення дуже довгого контенту, створеного ШІ. Я також вважаю його точним, особливо для вмісту, створеного ChatGPT. Однак він трохи втрачає прогнози, тому розглядайте його результати лише тоді, коли він показує понад 50% вмісту як підробку.

#4. Детектор вмісту Writer AI

Результати Writer AI Content Detector викликають сумніви під час виявлення вмісту з інструментів написання AI, але він чудово працює для вмісту, створеного ChatGPT. Ви можете сканувати 1500 символів за сканування та навіть додати URL-адресу вмісту, якщо він уже опублікований.

У моєму тестовому тексті, створеному штучним інтелектом, було сказано, що 94% вмісту створено людьми, що є досить незначним у порівнянні з іншими інструментами. Тим не менш, його все одно варто використовувати для виявлення вмісту ChatGPT, особливо якщо він уже опублікований.

#5. Проект і ціль

Простий, але потужний інструмент виявлення запису ШІ. З мого досвіду Draft & Goal запропонував подібні результати до Content At Scale, але він не має обмеження на кількість слів, щоб ви могли сканувати довгі записи. Однак час його сканування збільшується залежно від обсягу сканованого вмісту.

У моєму прикладі тексту сказано, що 94% тексту створено ШІ.

Мої думки 💭

Особисто я вважаю, що допомога штучного інтелекту – це чудовий спосіб усунути блокування письменника, отримати всю інформацію в одному місці та знайти натхнення. Однак він ніколи не повинен замінювати людське письмо, оскільки штучний інтелект обмежується вже відомими знаннями.

Ви також можете ознайомитися з найкращими інструментами перевірки на плагіат, щоб запобігти копіюванню.