У минулому, процес транскрибування був трудомістким і вимагав значних зусиль. Фахівці різних галузей, зокрема лікарі та журналісти, записували свої нотатки та бесіди на диктофони, а потім витрачали час, набираючи їх на комп’ютерах.
Сьогодні, у 2024 році, існує широкий спектр онлайн-сервісів, що дозволяють перетворювати аудіозаписи на текстові файли. Однак виникає питання про їхню безпеку. Адже користувачі можуть завантажувати конфіденційні аудіозаписи особистих розмов та голосові повідомлення.
Розгляньмо ці сервіси детальніше та обговоримо способи захисту вашої інформації.
Принципи роботи сервісів аудіотранскрипції
Сервіси транскрипції аудіо можна поділити на три основні категорії. Перша – це повністю автоматизовані системи, які використовують штучний інтелект (ШІ) та алгоритми машинного навчання для обробки мови. Друга – це транскрипція, що виконується людьми, яка є найбільш дорогою. І третя – комбінація автоматизованої обробки та ручної перевірки.
Найпоширенішою є перша категорія. Сервіси, такі як Google, Apple та Otter.ai, перетворюють звукові хвилі голосу на цифровий формат. Потім вони аналізують їх на мікроскопічні сегменти (іноді тисячні долі секунди) і порівнюють їх з відомими “фонемами” або елементами мови.
Далі ці алгоритми намагаються інтерпретувати їх в контексті інших фонем, використовуючи статистичні моделі та ШІ, і створюють текст. Оскільки ці сервіси є повністю автоматизованими, вони, зазвичай, є найдешевшими. Проте їхня точність може бути невисокою, особливо у шумному середовищі або під час розмов кількох осіб.
Ручна транскрипція передбачає використання платформ, на кшталт Rev, які поєднують клієнтів з професійними транскрибаторами. Також можна найняти фрілансера на таких платформах як Upwork або Fiverr.
Змішаний підхід поєднує автоматизовану обробку ШІ для початкової транскрипції, а потім ручну перевірку та редагування для підвищення точності.
Проблеми з безпекою сервісів транскрипції
Протягом останніх років багато сервісів транскрипції стикалися з порушеннями безпеки та скандалами.
Одним з найстаріших і, можливо, найшокуючих випадків був SpinVox, який у 2000-х роках пропонував послугу перетворення голосових повідомлень на текстові. Тоді це вважалося великим технологічним досягненням. Компанія швидко здобула популярність, залучила клієнтів та великі інвестиції.
Проблема полягала в тому, що клієнти не знали, що їхні голосові повідомлення обробляються людьми, які працювали в офісах у таких країнах, як Пакистан, Маврикій та Південна Африка. Інсайдер компанії стверджував, що лише 2% голосових повідомлень оброблялося автоматично, а решту обробляли близько 10 000 працівників.
Коли працівникам пакистанського офісу SpinVox перестали платити, вони почали надсилати повідомлення безпосередньо клієнтам на знак протесту. Згодом ця правда виявилася, і SpinVox втратив більшу частину своєї вартості. Врешті-решт, залишки компанії були продані Nuance, одному з найбільших постачальників технологій розпізнавання голосу.
Нещодавно, журналіст з кібербезпеки Браян Кребс виявив серйозний витік даних у MEDantex, постачальника послуг транскрипції для медичних працівників з Канзасу. В результаті витоку були оприлюднені конфіденційні медичні записи, деякі з яких датувалися 2007 роком. Вміст був доступний для завантаження з незахищеного порталу у вигляді файлів Microsoft Word.
Навіть сервіси цифрової транскрипції не є повністю безпечними. Навіть коли ви використовуєте повністю автоматизований сервіс, компанія може залучати підрядників для контролю якості.
У 2019 році бельгійський новинний сайт VRT NWS повідомив, що підрядники Google прослуховували розмови користувачів з їхніми розумними помічниками Google Home. Один з підрядників навіть надав VRT NWS доступ до цих розмов, багато з яких були дуже особистого характеру.
Amazon, Apple та Microsoft також використовували подібні практики. Тобто, хтось може прослуховувати аудіозаписи вашого віртуального помічника.
Чи надійні онлайн-сервіси транскрипції?
Головне питання полягає в тому, чи безпечні онлайн-сервіси транскрипції. На жаль, відповідь не є однозначною.
Сфера голосової транскрипції наразі є досить розвиненою. Більшість недобросовісних компаній вже виявлені.
Проте, довіряючи свої дані (особисті розмови) третій стороні, ви покладаєтеся на її здатність їх захищати. Це стосується як онлайн-сервісів, так і ручної транскрипції.
В кінцевому підсумку, ви повинні задати собі два питання: чи довіряєте ви сервісу і наскільки конфіденційною є ваша розмова?
Вибираючи сервіс транскрипції, варто провести власне дослідження. Чи має компанія позитивну репутацію? Чи є вона стабільною? Чи були випадки витоку даних в минулому? Чи існує політика конфіденційності, яка чітко визначає, як обробляються та захищаються ваші дані?
Як зазначалося раніше, послуги на основі ШІ часто залучають співробітників і підрядників для перевірки якості. Хоча ці перевірки є лише частиною загального процесу, завжди існує ймовірність, що хтось може прослухати вашу розмову.
У більшості випадків це не є порушенням умов використання. Проте, якщо ваша розмова має особистий або комерційно чутливий характер, можливо, варто розглянути варіант набору тексту вручну.