11 найкращих ресурсів для науки про дані та машинного навчання

Дані – це нова нафта. І машинне навчання – це вогонь. Той, хто контролює цих двох, буде контролювати світ.

Ні, це не якась пишна фраза, узята з антиутопічного роману.

Це реальність.

Новий світовий порядок полягає в тому, щоб зібрати величезну кількість релевантних даних і обробити їх у практичну інформацію — те, чого людство не могло зробити в історії. Це вид технології, який дозволяє країні випереджати інші та, зрештою, правити світом.

Як наслідок, прогресивні країни світу сприймають це дуже, дуже серйозно.

Вигідний вибір професії

Крім міжнародної інтриги, наука про дані та машинне навчання — це гаряча нова сфера з неймовірними можливостями. Попит зашкалює (м’яко кажучи), а науковців з обробки даних не вистачає. Навіть не посередніх.

Це ніби ми раптом відкрили багато нових населених планет, і не вистачає людей, щоб їх перенести. Я міг би продовжувати продовжувати і звучати як зламана платівка, але я думаю, що ця інфографіка справляється зі своєю роботою набагато краще:

Джерело: insidebigdata.com

Отже, ми бачимо, що зарплати починаються від $50 000+, а для менеджерів можуть перевищувати $250 000.

І не тільки це, середня людина на цій планеті генеруватиме 1,7 МБ даних за секунду. Це понад 3500 ТБ даних за весь термін служби — більше даних, ніж ми можемо обробляти на даний момент, не кажучи вже про використання для аналізу. Сказати, що майбутнє світле, означало б зробити погану послугу цьому чудовому новому пасовищу.

Наука про дані та машинне навчання важкі?

Хороше питання!

З мого досвіду, відповідь одночасно «так» і «ні».

Штучний інтелект (і, як наслідок, машинне навчання) — це найскладніше, що можна зробити, якщо ви схильні займатися дослідженнями та розширювати межі. За таку роботу навіть Ph.D. з інформатики та математики не вистачає. Але звичайна людина не має ані амбіцій, ані часу для такого заняття.

На іншому кінці я б назвав Applied Data Science і Machine Learning.

Тобто ви берете наявні інструменти, методи та алгоритми та застосовуєте їх для вирішення деяких реальних проблем. Ця частина вимагає відданості, сприйняття та креативного мислення (і знання деяких простих математичних понять, які швидко засвоюються), але щодо справжніх «технічних» знань, це набагато м’якше, ніж те, що називається роботою інженера-програміста.

Іншими словами, це не просто прогулянка, але, судячи з співвідношення винагороди до зусиль, це одна з найкращих інвестицій.

Тепер, коли ви зміцнили свою рішучість стати спеціалістом із обробки даних та інженером машинного навчання, давайте почнемо досліджувати найкращі варіанти.

Машинне навчання (Google)

Мало хто знає, але Google має широкий, дуже практичний і безкоштовний курс машинного навчання. За словами компанії, це частина їхнього зобов’язання щодо розвитку технологій AI/ML і збереження знань у відкритому доступі.

  Як експортувати дані Google Sheets в JSON і XML

Найкраще в цьому курсі те, що немає попередніх умов, але підготуйтеся, щоб витратити додатковий час на самостійне вивчення понять статистики.

Я маю на увазі, що це не потрібно, але якщо у вас немає досвіду в розширеній статистиці, пояснень у цьому курсі може бути недостатньо. Ще одна заковика полягає в тому, що цей курс представляє машинне навчання через TensorFlow, яка є реалізацією ML, розробленою Google. Таким чином, у певному сенсі Google прагне просувати свої API для машинного навчання, але, враховуючи цінність цього курсу, я не бачу, чому це має стати каменем спотикання.

У будь-якому разі TensorFlow є одним із простих способів потрапити в машинне навчання та користується шаленою популярністю (для порівняння фреймворків ШІ дивіться тут).

Data Science

Назва Гарвард викликає благоговіння, як і цей курс.

Перш за все: це не курс «давайте швидко забруднитися», де ви навшпиньки ходите навколо машинного навчання, пишучи тут фрагмент або сценарій. Цей курс — суворе вогневе хрещення, яке вимагає наполегливої ​​праці та значних витрат часу.

Курс постачається з безкоштовними відео, кодом (розміщеним на GitHub) і рішеннями для лабораторних вправ, тож вас практично нічого не стримує, якщо ви захочете це зробити.

Ідеальна аудиторія?

Ви… Я не жартую.

Я б сказав, що працюють професіонали з гідною математичною освітою, навіть якщо вони, можливо, більше не займаються математикою (звички робити висновки та доводи – це найнеобхідніше). Але ще раз, будь ласка, попереджаємо: ви можете думати, що ви хороші, але на цьому курсі ви будете відчувати себе так, ніби на сніданок закріпили нігті — практичні задачі досить складні, щоб змусити вас плакати, але тоді це може бути саме те, що ви повторно шукаєш!

Машинне навчання

Зайдіть у бар, наповнений науковцями з обробки даних, і запитайте, хто такий Ендрю Нґ, і ви отримаєте побої.

У колах науки про дані та машинного навчання Ендрю Нґ досяг богоподібного статусу завдяки своєму винятковому курсу на Coursera — Машинне навчання.

І якщо ви сумніваєтеся в повноваженнях Ендрю Нга, я дозволю цьому говорити само за себе:

Це платний курс, оскільки він є частиною тарифного плану Coursera, але фінансові зобов’язання та рішучість — не єдині передумови. Це довгий курс, оскільки Ендрю глибоко занурюється в математику, що лежить в основі всього ML, і розбирає популярні алгоритми. Але, на щастя, це повний курс, і вас крок за кроком проведуть у найтемніші глибини та повернуть назад.

Я дуже рекомендую, головним чином тому, що хизуватися сертифікатом про закінчення цього курсу сьогодні стало справою!

Прикладна наука про дані

Спеціалізації на Coursera складаються із серії курсів, які мають на меті перевести вас від нуля до володіння певною концепцією. Якщо ви шукаєте повний, серйозний, але дружній курс з Data Science та машинного навчання з Python, я не можу рекомендувати цей спеціалізація достатньо.

  Як запустити програми для iPhone та iPad на Mac

Після закінчення курсу ви отримуєте сертифікат.

DataCamp

DataCamp пропонує безліч курсів з науки про дані, які також включають кілька навичок і кар’єрних шляхів. Від маніпулювання даними до машинного навчання ви отримаєте кар’єрні навички вчених із обробки даних у Python і R, які допоможуть вам досягти успіху в галузі обробки даних.

Завдяки байтовому вмісту DataCamp ви можете навчатися у своєму власному темпі. Ці курси нададуть вам практичний досвід, за допомогою якого ви вдосконалите свої навички з обробки даних.

Ви можете почати з безкоштовної версії та оцінити курс, дивлячись на перший розділ.

edX

Навчайтеся в MITx, Harvardx, IBM, RICEx, UCSanDiegox і GTx на платформа edX.

Усі вони мають комплексну навчальну програму, яка допоможе вам оволодіти навичками обробки даних. Ці програми найкраще підходять для тих, хто має досвід статистики або інформатики.

Якщо ви не шукаєте програму, можете вибрати аля-карт. На edX ви знайдете понад 200 курсів, пов’язаних із наукою про дані, які охоплюють Python, R, Excel, ймовірність, статистику, машинне навчання, візуалізацію даних та багато іншого.

Codecademy

Codecademy — ще одна платформа, яка є однією з найкращих систем, яка допомагає вам навчитися кодувати. Вони вірять у «навчання на практиці» і мають на своїй платформі багато практичних проектів і тестів.

The курс науки про дані Codecademy включає SQL, Python 3, NumPy, Pandas, Matplotlib, Scikit-learn та багато інших бібліотек.

Весь кар’єрний шлях містить 26 курсів, яких більш ніж достатньо, щоб допомогти вам стати успішним науковцем з даних.

Цей курс даних:

  • Дає вам глибокі знання з науки про дані
  • Забезпечує легкий для дотримання дорожню карту
  • Готує вас до роботи, допомагаючи отримати достатній практичний досвід

Udemy

Udemy не потребує представлення.

Python for Data Science and Machine Learning Bootcamp на Udemy є одним із найпопулярніших курсів із понад 85 тис.+ рейтингом 4,6, який пройшли 370 тис.+ студентів по всьому світу.

Нижче наведено теми, які розглядаються в цьому курсі:

Нижче наведено особливості/результати цього курсу:

  • 25 годин відео на замовлення
  • Повний довічний доступ
  • 13 статей і п’ять ресурсів для завантаження
  • Доступ на мобільному телефоні та телевізорі
  • Сертифікат про закінчення
  • 30-денна гарантія повернення грошей

Отже, якщо ви віддаєте перевагу бюджетному курсу, цей курс найкраще підійде для початку.

Google AI

Вам було б цікаво навчитися машинному навчанню від експертів ML у Google?

Ну, тоді вам потрібно перевірити курси на Google AI.

На цій платформі є курси з машинного навчання та науки про дані, а також контент для студентів, розробників програмного забезпечення, спеціалістів із обробки даних і навіть дослідників. Ці курси безкоштовні.

  Як заблокувати або видалити друзів у WeChat

Щоб почати з, Прискорений курс машинного навчання у Google ШІ має бути вашим улюбленим курсом. Це швидкий курс із практичним вступом із використанням API TensorFlow. Нижче наведено деталі цього курсу:

Ця платформа також має спеціальні курси з важливих тем машинного навчання, наприклад кластеризація, системи рекомендацій, тестування та налагодження в машинному навчанні, розділення даних і розробка функцій у машинному навчанні. Якщо ви вже знаєте основи машинного навчання, ці курси будуть корисними.

Udacity

Udacity також є дуже популярною платформою для електронного навчання, яка містить безліч курсів про трендові технології. Він має декілька провідних галузевих програм, розроблених і визнаних провідними компаніями в усьому світі, такими як AT&T, AWS, Google, IBM.

Одна з програм Udacity призначена для Data Science – Школа даних. Ця програма допоможе вам працювати аналітиком даних, науковцем з даних, інженером із обробки даних і бізнес-аналітиком. Курс Data Scientist у цій програмі є ключовим, який охоплює концепції машинного навчання, глибокого навчання та розробки програмного забезпечення. Ви повинні мати базові знання машинного навчання, щоб вибрати цей курс.

Якщо ви знаєте програмування на Python, але не знайомі з машинним навчанням, на Udacity є інша програма – Школа ШІ. У цій програмі є курси, починаючи з основ машинного навчання.

Глибоке навчання

Цей курс це благословення, і це моя найулюбленіша рекомендація в цьому списку, якщо ви кодер.

Я б повторив це ще раз: якщо ви програміст.

Це тому, що цей курс не витрачає час на навчання основам програмування. В описі курсу це сказано дуже чітко (курсив оригінальний):

Ми припускаємо, що кожен, хто проходить цей курс, має принаймні один рік досвіду програмування. Курс використовує python як мову навчання, тому, якщо ви ще не знаєте python, ми припускаємо, що ви витратите час на вивчення — для досвідченого програміста ви повинні переконатися, що python є досить легкою мовою для вивчення.

Отже, якщо ви вже знаєте Python (якщо ні вчись тут), або можете швидко освоїтися, це ідеальний курс для прагматиків, які хочуть будувати справжні, придатні для використання системи, не турбуючись надто про теоретичні основи алгоритмів.

Я навіть можу сказати, що це для нетерплячих майстрів (як я!), які ненавидять церемонію та одноманітність.

І о, я вже згадував, що це 100% безкоштовно та має чудову спільноту?!

Висновок

Фу!

Цей список було важко скласти. Не тому, що не було достатньо хороших джерел, а тому, що їх було забагато!

Машинне навчання – це сфера, яка буквально вибухнула та справді елегантно вирішує складні проблеми, тому в Інтернеті є сотні курсів, безкоштовних і платних, більшість із яких дійсно, дуже хороші. Але це також може бути джерелом плутанини, тому я спробував звести його до одинадцяти для різних типів учнів відповідно до рівня їх досвіду.

Сподіваюся, допомогло!