Яку структуру глибокого навчання використовувати?

Зміст

Якщо ви вивчаєте глибоке навчання, то, безумовно, стикалися з порівнянням PyTorch і TensorFlow.

PyTorch та TensorFlow – це два провідних фреймворки для глибокого навчання. Ця стаття надає детальне порівняння їхніх основних характеристик, що допоможе вам визначитися з вибором фреймворку для вашого майбутнього проєкту з глибокого навчання.

Спочатку ми розглянемо кожну з цих платформ, а потім підсумуємо їх функціональні можливості.

Отже, почнемо!

Що таке PyTorch?

PyTorch – це відкрита платформа, призначена для розробки моделей машинного та глибокого навчання для широкого спектру задач, включаючи обробку природної мови та комп’ютерний зір.

Цей фреймворк, створений Meta AI (раніше Facebook AI) у 2016 році, базується на Torch, який був написаний на Lua, та має “Pythonic” інтерфейс.

Нещодавно Meta AI випустила PyTorch 2.0, який пропонує розширені можливості для розподіленого навчання, компіляції моделей та роботи з графовими нейронними мережами.

Що таке TensorFlow?

TensorFlow, розроблений Google і представлений у 2014 році, є наскрізною платформою з відкритим вихідним кодом для машинного навчання. Він включає інструменти для підготовки даних, розгортання моделей і MLOps.

TensorFlow забезпечує кросплатформну розробку та підтримку на кожному етапі життєвого циклу машинного навчання.

Порівняння PyTorch і TensorFlow

Обидва фреймворки є дуже популярними серед розробників глибокого навчання. Для більшості проєктів вони надають необхідний набір інструментів.

Джерело зображення: star-history.com

Далі ми розглянемо основні можливості PyTorch і TensorFlow та визначимо, коли який фреймворк є більш доцільним.

#1. Бібліотека наборів даних та попередньо навчених моделей

Для ефективної роботи платформа глибокого навчання має надавати широкий спектр інструментів. Часто розробники не хочуть створювати модель з нуля, а використовують вже готові попередньо навчені моделі, адаптуючи їх під свої задачі.

Так само важливо мати легкий доступ до популярних наборів даних. Це дозволить швидко розробляти експериментальні моделі без необхідності створення конвеєрів збору даних або імпорту та очищення даних з інших джерел.

Тому бажано, щоб фреймворки мали як набори даних, так і попередньо навчені моделі для прискорення процесу розробки.

Набори даних і моделі PyTorch

PyTorch пропонує бібліотеки torchtext, torchaudio та torchvision для обробки природної мови, аудіо та зображень відповідно. Використовуючи PyTorch, ви можете скористатися наборами даних та моделями, що надаються цими бібліотеками, зокрема:

torchtext.datasets і torchtext.models для наборів даних та моделей обробки природної мови.
torchvision.datasets і torchvision.models надають набори даних зображень та попередньо навчені моделі для комп’ютерного зору.
torchaudio.datasets і torchaudio.models для аудіоданих та попередньо навчених моделей.

Набори даних і моделі TensorFlow

Моделі PyTorch і TensorFlow також можна знайти в HuggingFace Model Hub.

#2. Підтримка розгортання

У дискусії про PyTorch проти TensorFlow, питання розгортання є одним із найважливіших.

Хороший початок – це розроблена модель, яка добре працює в вашому локальному середовищі. Однак, для отримання реальної користі від машинного навчання, важливо розгорнути модель у виробничому середовищі та постійно її моніторити.

Далі ми розглянемо інструменти, які PyTorch і TensorFlow надають для розгортання моделей машинного навчання у виробничих умовах.

TensorFlow Extended (TFX)

TensorFlow Extended (TFX) – це платформа для розгортання на базі TensorFlow, яка надає інструменти для організації та підтримки конвеєрів машинного навчання, включаючи перевірку та перетворення даних.

TensorFlow Serving дозволяє розгортати моделі машинного навчання у виробничому середовищі.

TorchServe

Існує думка, що PyTorch більш популярний у дослідницькому середовищі, а TensorFlow – у промисловості. Проте останнім часом обидва фреймворки стали широко використовуватись.

Подібно до TensorFlow Serving, PyTorch пропонує TorchServe, простий фреймворк для розгортання моделей PyTorch у виробничих умовах. Також, можна використовувати TensorFlow Lite для розгортання моделей на мобільних та інших периферійних пристроях.

Незважаючи на те, що обидва фреймворки надають інструменти для розгортання, TensorFlow має вбудовану підтримку цього процесу, що робить його оптимальним вибором для виробничого середовища.

#3. Інструменти для інтерпретації моделей

Моделі глибокого навчання часто застосовуються у сферах, де необхідна прозорість, наприклад, охорона здоров’я та фінанси. Однак, коли моделі є “чорними скриньками”, виникає проблема інтерпретації їхніх прогнозів.

Це призвело до розвитку методів інтерпретованого машинного навчання (explainable ML), які допомагають зрозуміти, як працюють нейронні мережі та інші моделі машинного навчання.

Можливість інтерпретувати роботу моделей є надзвичайно важливою для глибокого навчання. Далі ми розглянемо інструменти для цього, які пропонують PyTorch і TensorFlow.

PyTorch Captum

PyTorch Captum – це бібліотека для інтерпретації моделей PyTorch, що пропонує ряд функцій, включаючи:

Методи атрибуції:

Інтегровані градієнти
LIME, SHAP
DeepLIFT
GradCAM та його варіації
Методи шарової атрибуції

TensorFlow Explain (tf-explain)

Tensorflow Explain (tf-explain) — це бібліотека для інтерпретації нейронних мереж, що включає:

Інтегровані градієнти
GradCAM
SmoothGrad
Vanilla градієнти та інші.

Після інтерпретації моделей, розглянемо важливий аспект – конфіденційність.

#4. Підтримка машинного навчання зі збереженням конфіденційності

Ефективність моделей машинного навчання залежить від доступу до реальних даних. Однак це створює ризик втрати конфіденційності. Останнім часом значного прогресу досягнуто у розвитку технік машинного навчання, що зберігають конфіденційність, таких як диференційна конфіденційність та федеративне навчання.

PyTorch Opacus

Навчання з диференційною конфіденційністю забезпечує, що окремі записи в наборі даних не розкривають індивідуальну інформацію, зберігаючи при цьому їхню корисність для аналізу набору даних в цілому.

PyTorch Opacus дозволяє навчати моделі з диференційною конфіденційністю. Щоб дізнатися більше, ознайомтеся зі вступом до Opacus.

TensorFlow Federated

Федеративне навчання усуває потребу в централізованому зборі даних. У цьому випадку дані ніколи не покидають приміщення власника, що сприяє кращому управлінню даними.

TensorFlow Federated пропонує інструменти для навчання моделей на децентралізованих даних.

#5. Легкість навчання

PyTorch – це “Pythonic” фреймворк глибокого навчання, що вимагає від користувача середнього рівня знання Python, зокрема розуміння концепцій об’єктно-орієнтованого програмування, таких як успадкування.

У TensorFlow можна використовувати Keras API, який є високорівневим API, що спрощує роботу з низькорівневими реалізаціями. Тому, якщо ви тільки починаєте свій шлях у глибокому навчанні, Keras може здатися більш простим у використанні.

PyTorch проти TensorFlow: порівняння

Підсумовуючи, ось порівняння основних особливостей PyTorch і TensorFlow:

Функціональність	PyTorch	TensorFlow
Набори даних та попередньо навчені моделі	Бібліотеки `torchtext`, `torchaudio` і `torchvision`	Бібліотеки наборів даних та попередньо навчених моделей
Розгортання	`TorchServe` для обслуговування моделей	`TensorFlow Serving` та `TensorFlow Lite` для розгортання моделей
Інтерпретація моделей	`PyTorch Captum`	`tf-explain`
Машинне навчання зі збереженням конфіденційності	`PyTorch Opacus` для навчання з диференційною конфіденційністю	`TensorFlow Federated` для федеративного машинного навчання
Легкість навчання	Вимагає середнього рівня знання Python	Відносно легший у вивченні та використанні

Навчальні ресурси

На завершення нашої розмови, розглянемо корисні ресурси для вивчення PyTorch і TensorFlow. Це не є вичерпний список, а лише кілька вибраних ресурсів, які допоможуть вам швидко освоїти ці фреймворки.

#1. Глибоке навчання з PyTorch: 60-хвилинний бліц

60-хвилинний підручник на офіційному веб-сайті PyTorch є чудовим стартом для вивчення PyTorch.

Цей підручник допоможе вам освоїти основи PyTorch, такі як тензори та автоматичне обчислення градієнтів, а також побудувати базову нейронну мережу для класифікації зображень.

#2. Глибоке навчання з PyTorch: від нуля до GAN

Deep Learning with PyTorch: Zero to GANs від Jovian.ai – це комплексний ресурс для вивчення глибокого навчання з використанням PyTorch. Приблизно за шість тижнів ви навчитеся:

Основам PyTorch: тензорам і градієнтам
Лінійній регресії в PyTorch
Створювати глибокі нейронні мережі, ConvNets і ResNets у PyTorch
Побудові генеративних змагальних мереж (GAN)

#3. Повний курс TensorFlow 2.0

Якщо ви хочете вивчити TensorFlow, повний курс TensorFlow 2.0 на каналі freeCodeCamp буде дуже корисним.

#4. TensorFlow – Python Deep Learning Neural Network API від DeepLizard

Ще один чудовий курс TensorFlow для початківців від DeepLizard. Цей курс допоможе вам освоїти основи глибокого навчання, зокрема:

Завантаження та попередню обробку наборів даних
Побудову класичних нейронних мереж
Побудову згорткових нейронних мереж (CNN)

Висновок

Сподіваємося, ця стаття допомогла вам отримати загальне уявлення про PyTorch і TensorFlow. Вибір оптимального фреймворку залежить від конкретного проєкту. При цьому варто враховувати такі фактори, як підтримка розгортання та інтерпретація моделей.

Ви програміст на Python і хочете вивчити ці фреймворки? Якщо так, то ви можете скористатися одним або кількома ресурсами, наведеними вище.

Якщо ви цікавитеся обробкою природної мови, то можете переглянути цей список курсів з обробки природної мови. Успіхів у навчанні!