Початок знайомства з Power BI чи хочете дізнатися більше? Ви маєте почати з моделювання даних у Power BI, потім проробити свій шлях через інтелектуальний аналіз даних і, нарешті, витягти корисну інформацію зі звітів Power BI.
Моделювання даних є основою будь-якого проекту аналітики даних. Він залишається нижче фактичних візуалізацій даних і інформаційних панелей, які бачить загальна аудиторія.
Як і будь-який інший інструмент аналізу даних, Power BI також потребує моделювання даних у серверній частині для інтеграції даних, перетворення даних, створення зв’язків між різними таблицями вхідного набору даних, додавання обчислень тощо.
Продовжуйте читати, щоб дізнатися все, що вам потрібно знати про моделювання даних у Power BI, включно з простими покроковими інструкціями щодо створення моделі даних Power BI.
Що таке моделювання даних?
У моделюванні даних ви створюєте спрощене представлення структур даних, зв’язків і атрибутів, зв’язуючи базові блоки наборів даних, наприклад таблиці, рядки, стовпці тощо.
Це допомагає в організації та розумінні даних для ефективного зберігання, пошуку та аналізу. Базова модель даних допомагає проектувати бази даних, програмне забезпечення та системи.
Моделювання даних передбачає ідентифікацію об’єктів, визначення їхніх властивостей і показ того, як вони з’єднуються один з одним, щоб генерувати шаблони та практичні ідеї. Це вкрай важливо для аналізу даних, забезпечення точності даних і підтримки процесів прийняття рішень.
Наскільки це важливо для аналізу даних у Power BI
Моделювання даних відіграє ключову роль у таких інструментах аналізу даних, як Power BI. Цей інструмент бізнес-аналітики спирається на добре структуровані моделі даних для створення значущих візуалізацій і розуміння.
Використовуючи принципи моделювання даних, ви можете ефективно з’єднувати, перетворювати та візуалізувати дані з кількох джерел у великому наборі даних. Моделювання даних у Power BI також допомагає переконатися, що дані, представлені в цих інструментах аналітики, точні та релевантні
Нарешті, це полегшує прийняття обґрунтованих рішень і розкриває повний потенціал ідей на основі даних. По суті, він також виступає основою, на якій потужні інструменти аналізу даних, такі як Power BI, можуть надавати цінну бізнес-аналітику.
Типи моделювання даних
#1. Концептуальне моделювання даних
Він фокусується на загальній картині даних. Отже, концептуальне моделювання представляє дані на високому рівні без урахування конкретних структур бази даних або технічних деталей. Ця концепція допомагає узгодити дані з цілями організації та допомагає зацікавленим сторонам зрозуміти призначення та значення даних.
#2. Моделювання фізичних даних
Коли ви моделюєте свій набір даних на основі аспекту технічної реалізації для зберігання та пошуку, це фізичне моделювання даних. Він визначає структури зберігання даних, такі як таблиці, індекси та обмеження, які можна використовувати в системі баз даних.
#3. Логічне моделювання даних
Логічне моделювання даних усуває розрив між концептуальним і фізичним моделюванням. Таке моделювання служить схемою для розробки бази даних і полегшує спілкування між зацікавленими сторонами бізнесу та технічними командами, зберігаючи при цьому цілісність і послідовність даних.
Методи моделювання даних у Power BI
#1. Зіркова схема
Зірчаста схема — це техніка моделювання даних, яка часто використовується в Power BI. У цьому підході існує центральна таблиця фактів, яка містить ключові показники та показники, оточена таблицями вимірювань, які надають контекст даних. Її називають «зіркою», тому що таблиця фактів знаходиться в центрі, з’єднана з таблицями розмірів, як точки зірки.
#2. Кардинальність
Кардинальність визначає зв’язок між таблицями в Power BI. Він визначає, скільки унікальних значень в одній таблиці відповідає значенням в іншій. Варіанти кардинальності включають один до одного, один до багатьох і багато до одного. Вибір правильної потужності має вирішальне значення для точного моделювання даних.
#3. Напрямок перехресного фільтра
Те, як фільтр, застосований до даних в одній пов’язаній таблиці, впливатиме на дані іншої таблиці, називається напрямком перехресного фільтра. Існує два типи напряму перехресного фільтра, і вони наведені нижче:
неодружений
Один напрямок крос-фільтра — це варіант зв’язку, коли фільтри можуть проходити лише в одному напрямку, як правило, від таблиці розмірів до таблиці фактів. Це гарантує, що фільтрація таблиці розмірності впливає на таблицю фактів, але не навпаки.
Двонаправлений
Двонаправлений перехресний фільтр дозволяє фільтрам проходити в обох напрямках між таблицями фактів і таблицями розмірів. Це може бути корисним у деяких сценаріях, але його слід використовувати обережно, оскільки це може призвести до несподіваних результатів, якщо не керувати належним чином.
#4. Схема сніжинки
Кредит зображення: Learn.Microsoft.Com
Схема «Сніжинка» є розширенням схеми «Зірка», де таблиці розмірів далі нормалізуються на підвиміри. Це створює більш структуровану, але складну схему. Хоча це може зменшити надмірність даних, для навігації в Power BI може знадобитися більше зусиль.
#5. Таблиці пошуку
Таблиці пошуку — це таблиці розмірів, які містять довідкову інформацію, як-от відомості про продукт або географічні дані. Вони використовуються для збагачення даних у таблицях фактів, надаючи додатковий контекст для аналізу.
#6. Таблиці даних
Таблиці даних – це термін, який іноді використовується як синоніми з таблицями фактів. Вони містять первинні дані, зокрема показники та зовнішні ключі, і служать основою для створення звітів і візуалізацій Power BI.
Переваги моделювання даних у Power BI
Як зробити моделювання даних у Power BI
Створити модель даних у Power BI дуже просто. Ось кроки, які ви повинні виконати:
Імпортуйте свій набір даних у Power BI
По-перше, ви повинні імпортувати набори даних у Power BI. Ви можете імпортувати скільки завгодно наборів даних або набір даних, який містить багато об’єктів даних, наприклад таблиць, стовпців, рядків тощо.
Power BI автоматично проаналізує імпортований набір даних або об’єкти даних і створить первинну модель даних на основі імен заголовків стовпців або заголовків таблиці.
Щоб імпортувати набори даних, виконайте такі дії:
- Відкрийте настільну програму Power BI.
- На ньому має відображатися робоче середовище Power BI разом із заставкою.
- Натисніть Отримати дані.
- У діалоговому вікні «Отримати дані» ви можете вибрати категорію даних, яку потрібно імпортувати, на лівій навігаційній панелі та джерела або типи даних на правій навігаційній панелі.
- Вибір типу джерела даних за замовчуванням — «Усі».
- Оскільки мій набір даних міститься в книзі Excel, я виберу опцію «Книга Excel» праворуч і натисну «Підключити».
- У діалоговому вікні «Відкрити» перейдіть до файлу Excel, який потрібно імпортувати на ПК, і двічі клацніть файл, щоб імпортувати його в Power BI.
- Тепер ви повинні бути в діалоговому вікні навігатора.
- Там позначте об’єкти даних, які потрібно імпортувати до звіту Power BI.
- Натисніть «Завантажити», щоб завершити процес імпорту даних у Power BI.
Створіть модель даних Power BI
Коли ви натискаєте кнопку «Завантажити» у навігаторі, Power BI починає аналізувати набір даних, створювати моделі об’єктів даних, створювати моделі даних і, нарешті, переходити на вкладку «Перегляд звіту».
Якщо ви клацнете меню Таблиця на лівій бічній панелі, ви повинні отримати табличні представлення всіх об’єктів даних, які ви щойно імпортували в Power BI.
Power BI не збереже вашу роботу автоматично. Отже, вам потрібно клацнути «Файл» у меню стрічки, а потім клацнути «Зберегти» на лівій бічній панелі, щоб зберегти файл у певному місці на вашому ПК.
Тепер ми заглибимося в процес моделювання даних у Power BI. Виконайте такі дії:
- Клацніть вкладку «Перегляд моделі» на лівій панелі робочої області Power BI.
- Тепер ви повинні побачити модель даних за замовчуванням, створену Power BI.
- У поточному прикладі це схема зі зіркою, оскільки посередині є таблиця фактів, а таблиця фактів оточена таблицями розмірів.
- Тепер Power BI не завжди може точно створювати потрібні підключення моделі даних.
- У поточному прикладі він не зміг зв’язати таблицю фактів із розміром Table24, хоча існують подібні заголовки стовпців Geography і Geo.
- Він не міг цього зробити, оскільки заголовки стовпців не збігаються.
- Два зв’язують Table24 із основними даними таблиці фактів, просто перетягніть об’єкт Geo таблиці Table24 на елемент Geography таблиці фактів у центрі.
Це воно! Ви успішно створили модель даних у Power BI. Знайдіть нижче значення різних об’єктів на лініях зв’язку:
- Зірка на краю таблиці фактів і цифра 1 на краю таблиці розмірів представляють з’єднання «один до багатьох».
- Стрілка на сполучній лінії між двома таблицями в Power BI вказує напрямок фільтра. Коли гострий край стрілки спрямований до таблиці фактів, будь-який фільтр, застосований до таблиці розмірів, впливатиме на таблицю фактів.
- Коли є дві стрілки, фільтр впливає на таблицю з обох сторін, тобто на таблицю фактів і розмірів.
Візуалізуйте свої дані
Ось як ви тепер можете візуалізувати свій набір даних, щоб отримувати корисну статистику:
- Перейдіть на вкладку Перегляд звіту.
- Виберіть будь-яку діаграму в розділі Візуалізації праворуч.
- Я вибрав стовпчасту діаграму з накопиченням.
- Розгорніть набори даних у правій частині робочої області Power BI.
- Перетягніть елементи на поля осі X і Y у редакторі діаграм.
- Power BI автоматично створить для вас діаграму.
Випадки використання моделювання даних у Power BI
Створюйте цілісні звіти
Щоб створити багатовимірний звіт або інформаційну панель на Power BI, ви повинні використовувати функції моделі даних Power BI. Дані в одній таблиці можуть мати недостатній сенс. Однак, коли ви передаєте дані з різних наборів даних і об’єктів, ви можете візуалізувати дані в кращому сенсі.
Інтеграція даних
Припустімо, що у вихідній книзі Excel або базі даних SQL є багато наборів даних або таблиць даних. Замість того, щоб створювати різні звіти Power BI, ви можете об’єднати їх усі в схему зірок або сніжинок і візуалізувати їх як єдине ціле. Ви можете покращити оповідання даних, об’єднавши всі об’єкти даних.
Очищення та перетворення даних
Коли ви намагаєтеся створити моделі даних Power BI, стає очевидним, чи потрібно очищати та перетворювати необроблений набір даних.
Наприклад, якщо інструменту не вдається зв’язати пов’язані стовпці даних або таблиці в моделі даних, тоді може бути невідповідність заголовків стовпців. Отже, ви знаєте, що потрібно виправити.
Іншим прикладом може бути декілька елементів у таблицях. Припустімо, що в наборі даних лише 4 географічні регіони, а саме США, Каліфорнія, Великобританія та Німеччина. Але модель даних показує додатковий, який є порожнім. Це тому, що деякі географічні назви містять непотрібні пробіли, і тому Power BI класифікує їх у новому географічному елементі.
Контроль видимості даних
Ви можете обмежити, хто може переглядати, що у вашому звіті або на інформаційній панелі Power BI за допомогою вкладки «Перегляд моделі». Клацнувши піктограму ока на кожній картці даних у робочій області моделі даних Power BI, ви можете приховати або відобразити таблицю.
Якщо на картці даних є кілька стовпців, ви також можете налаштувати видимість цих стовпців.
Маніпулювання вибраними таблицями даних
Кожна таблиця даних в інтерфейсі моделі даних Power BI має додаткові параметри або піктограму з трьома крапками. Там ви можете знайти такі дії, які можна виконувати з вибраною таблицею даних:
- Нова міра або стовпець
- Оновити дані
- Керуйте стосунками
- Поступове оновлення
- Керуйте агрегаціями
- І багато іншого
Висновок
Отже, це все про створення Power BI модель даних для візуалізації великих і розподілених наборів даних в одному логічному звіті або інформаційній панелі.
Наразі ви дізналися про різні методи моделювання даних у Power BI. Крім того, ви знайшли кроки для створення моделі даних Power BI з нуля. Виконайте кроки та миттєво створіть власну модель даних.
Далі – найкращі курси аналітика даних, які допоможуть розпочати вашу кар’єру аналітика чи науки про дані.