Прочитайте цю статтю до кінця, щоб розкрити секрети налаштування інкрементального оновлення в Power BI, щоб зменшити витрати на обчислення хмарних екземплярів і швидко отримати дані в реальному часі.
Під час роботи з великими наборами даних для бізнес-аналітики оновлення даних із сервера стає складним завданням. База даних, яку ви аналізуєте у своїй програмі Power BI, постійно оновлюється у серверній частині.
Якщо ви оновите набір даних, він може продовжувати оновлюватися годинами або навіть більше, якщо він величезний, або отримувати канали даних у реальному часі з багатьох автоматизованих машин, як-от роздрібні точки продажу, онлайн-каси, дані онлайн-форм тощо.
Щоб впоратися з такими складними ситуаціями під час імпорту й аналізу даних у Power BI, Microsoft включила кілька функцій оновлення даних. Оскільки така функція є поступовим оновленням, вона досить популярна для легкого імпорту та аналізу даних у реальному часі.
Читайте далі, щоб дізнатися, що це таке, що він робить, які передумови для використання цього інструменту в Power BI та як його легко налаштувати. Давайте розпочнемо!
Читайте також: Tableau проти Power BI: кращий вибір у 2023 році?
Інкрементне оновлення в Power BI
Поступове оновлення — це розширення запланованого оновлення даних у Power BI. Він створює різні розділи набору даних у своєму просторі для зберігання, відокремлюючи таблиці набору даних, які часто оновлюються.
Більшість баз даних, якими ви користуєтеся, містять кілька таблиць, які часто оновлюються, оскільки вони містять дані про транзакції, як-от суми продажів, інвентарні номери тощо. З часом ці дані можуть експоненціально збільшуватися, через що вихідний файл Power BI займає величезний простір у вашій хмарі або локальні сервери.
Тут Power BI може використовувати політику поступового оновлення, щоб розділити таблицю даних відповідно до параметрів RangeStart і RangeEnd. Він також може використовувати розділ DirectQuery для даних у реальному часі. Зрештою, дані, які ви запитуєте з хмарної бази даних, зменшуються, тому імпортований набір даних у вашій програмі Power BI стає меншим і з ним легше працювати.
Поступове оновлення гарантує, що ви завжди матимете справу з найновішими даними у великій базі даних, яка містить мільйони рядків.
Наприклад, ви отримали звіт про продажі, що містить дані за 10 років. Однак вам не завжди потрібно оновлювати весь набір даних. Вам може знадобитися оновлення лише за останній тиждень або близько того.
У цьому випадку, якщо ви виконуєте повне оновлення набору даних, може знадобитися кілька годин, поки Power BI завершить це завдання. Замість цього ви можете просто налаштувати поступове оновлення та заощадити час і гроші на витратах на обчислення.
Читайте також: Сертифікація Microsoft Power BI Data Analyst (PL-300): як її отримати
Чому варто використовувати інкрементне оновлення в Power BI?
Використання інкрементного оновлення в Power BI є розумним кроком з трьох основних причин. По-перше, це економить час і ресурси. Замість кожного разу оновлювати всі дані, він зосереджується лише на нових або змінених даних, що робить ваші звіти швидшими та ефективнішими.
По-друге, він ідеально підходить для великих наборів даних. Якщо у вас є величезний обсяг даних, оновлення всього може бути повільним і дорогим. Поступове оновлення дає змогу оновлювати лише те, що є необхідним, забезпечуючи оперативність звітів.
По-третє, він забезпечує актуальність ваших звітів. Націлюючись на останні дані, ви гарантуєте, що ваші звіти відображають найновіші зміни у вашому джерелі даних, надаючи точну інформацію для прийняття кращих рішень.
Випадки використання поступового оновлення
Роздрібні продажі
Поступове оновлення допомагає оновлювати щоденні дані про продажі, не переробляючи цілі звіти. Таким чином, ви гарантуєте актуальну інформацію для кращого прийняття рішень. Це також дає змогу відстежувати щоденні показники залученості, заощаджуючи час і ресурси, лише оновлюючи нові дані або діапазон, який ви налаштували.
Управління запасами
Якщо вам потрібно відстежувати зміни запасів у реальному часі та ефективно оптимізувати рівень запасів, ви можете налаштувати поступове оновлення в таких звітах Power BI. Це також може допомогти вам у постійному оновленні статистики веб-трафіку для отримання найновішої інформації про поведінку користувачів.
Фінансова звітність
Поступове оновлення допомагає підтримувати актуальність фінансових звітів, регулярно оновлюючи лише найновіші дані. Ви також можете бути в курсі оновлень ланцюга постачання, пов’язаних із фінансами, і покращити реагування на динамічні зміни витрат у ланцюзі постачання.
Моніторинг IoT
Поступове оновлення особливо важливо для навчання та моніторингу пристроїв IoT. Пристрої IoT щодня збирають і надсилають величезну кількість даних, оскільки вони збирають дані щосекунди. Якщо ви починаєте оновлювати всю базу даних, пов’язану з декількома системами IoT, процес може тривати кілька днів. Натомість ви встановлюєте поступове оновлення й оновлюєте лише необхідну частину за весь день.
Аналіз фондового ринку
Фондовий ринок є ще одним популярним джерелом, яке щосекунди створює масові оновлення даних. Тут ви можете скористатися функцією поступового оновлення Power BI, щоб нарізати і розділити рухи вгору або вниз кількох цін на акції, щоб передбачити свої інвестиційні стратегії.
Переваги інкрементального оновлення в Power BI
Переваги поступового оновлення безмежні, оскільки ви можете використовувати його по-різному, залежно від проекту з науки про дані та аналітики даних, над яким ви працюєте.
Повне оновлення проти. Інкрементне оновлення в Power BI
Повне оновлення в Power BI передбачає перезавантаження всіх даних із джерела. Це трудомісткий і ресурсомісткий процес для великих наборів даних. Він замінює весь набір даних, навіть якщо змінилася лише невелика частина даних.
З іншого боку, поступове оновлення оновлює лише нові або змінені дані, значно скорочуючи час оновлення та використання ресурсів.
Нижче знайдіть різницю між цими двома режимами оновлення Power BI:
Порівняння функційПовне оновленняПоступове оновленняОновлення данихОновлює всі дані кожного разуОновлює лише нові, змінені чи налаштовані діапазони дат/часуПідходить для невеликих наборів даних із нечастими оновленнямиВеликих наборів даних із частими оновленнямиЧас оновлення Триваліший час оновлення Швидший час оновленняВикористання ресурсів Більше використання ресурсівНижче використання ресурсівІсторичні дані Вимагати es перезавантаження всіх історичних даних. Зберігає історичні дані у визначених розділах або archivesReal Підтримка даних у реальному часі Обмежена підтримка даних у реальному часі Підтримує оновлення даних у режимі реального часу або майже в реальному часі
Передумови інкрементального оновлення
Хоча ця функція дуже популярна для великих наборів даних, але вона не є легкодоступною, доки план Power BI та інші параметри набору даних не відповідатимуть певним умовам. Знайдіть ці вимоги нижче:
#1. Підтримувані плани Power BI
Поступове оновлення доступне для наборів даних Power BI Premium, Premium per user, Power BI Pro та Power BI Embedded.
Для оновлення даних у реальному часі через DirectQuery підтримка обмежена наборами даних Power BI Premium, Premium per user і Power BI Embedded.
#2. Підтримувані джерела набору даних
Оновлення даних у реальному часі для великого набору даних у звітах Power BI за допомогою поступового оновлення найкраще підходить для реляційних і структурованих баз даних, таких як Azure Synapse і SQL Database. Ви також можете змусити його працювати з іншими базами даних за допомогою спеціальної конфігурації.
Однак набір даних повинен містити або підтримувати таке:
Стовпець Дата/Час
У наборі даних, який ви аналізуєте, має бути стовпець дати або дати/часу з поступовим оновленням. Ці стовпці допомагають Power BI створювати початкову та кінцеву точки для даних, які оновлюються з вихідного сервера.
Фільтрування дати/часу
Power BI має мати можливість фільтрувати набір даних за даними за датою, як правило, через стовпець дати в цільовій таблиці, який може мати дату/час або цілочисельний тип даних у реляційних джерелах. Параметри RangeStart і RangeEnd, обидва в типі даних дати/часу, фільтрують дані таблиці за допомогою стовпця дати.
Параметри діапазону
Перш ніж почати додавати події поступового оновлення у свій звіт Power BI, потрібно перенести набір даних у Power Query, щоб додати параметри діапазону. Використовуючи команду «Керувати параметрами», ви повинні додати два нові параметри з іменами RangeStart і RangeEnd для цільового набору даних.
Набір даних підтримує згортання запитів
Згортання запитів — це техніка оптимізації бази даних, яка покращує продуктивність запитів, повертаючи якомога більше роботи з обробки даних на сервер бази даних.
Замість того, щоб отримувати велику кількість даних із сервера бази даних, а потім фільтрувати та обробляти їх у клієнтській програмі, згортання запитів дозволяє серверу баз даних виконувати операції фільтрації, сортування та агрегації безпосередньо на джерелі даних.
Єдине джерело даних
Припустімо, ви налаштовуєте поступове оновлення для отримання даних у реальному часі для великої бази даних. Або ви створюєте розширену систему запитів до бази даних за допомогою табличної об’єктної моделі (TOM) і мови сценаріїв табличної моделі (TMSL) через кінцеву точку XMLA. У таких ситуаціях усі розділи даних, будь то DirectQuery чи Import, повинні запитуватися з одного джерела даних.
#3. Системна дата й час
Наявність доступу до системної дати й часу необхідна для Power BI, щоб розуміти, коли слід поступово оновлювати дані відповідно до визначеної вами політики. Отже, ви завжди повинні встановлювати системну дату й час на автоматичні, а не вручну.
Як налаштувати інкрементне оновлення в Power BI
Нижче наведено чотири прості кроки, щоб налаштувати поступове оновлення:
#1. Імпорт вашого набору даних до настільної програми Power BI
Ви можете налаштувати поступове оновлення звіту Power BI лише з настільної програми Power BI. Після публікації звіту ви можете скористатися цією функцією, щоб отримати дані в реальному часі або дані з вибраного діапазону в інструменті служби Power BI (веб-версія Power BI).
Щоб імпортувати набір даних, виконайте такі дії:
- Запустіть програму Power BI Desktop.
- Натисніть кнопку «Отримати дані» на екрані-заставці Power BI.
- У діалоговому вікні «Отримати дані» виберіть джерело бази даних, наприклад «База даних SQL Server».
- Введіть дані SQL-сервера та натисніть OK.
- Тепер ви повинні побачити навігатор набору даних бази даних.
- Виберіть таблицю з навігатора та натисніть «Завантажити», щоб отримати дані в Power BI.
#2. Обробка набору даних у Power Query
Тепер ви повинні перетворити набір даних у Power Query, щоб додати діапазонні параметри та фільтрацію дати й часу. Ось як:
- У Power BI перейдіть на вкладку «Домашня сторінка» на стрічці та натисніть команду «Трансформувати дані».
- Тепер набір даних відкриється в Power Query.
- Натисніть стовпець Дата.
- Тепер натисніть «Керувати параметрами».
- У діалоговому вікні «Керування параметрами» натисніть «Створити».
- У полі Ім’я введіть RangeStart.
- У полі «Поточне значення» введіть дату початку або дату/час поступового оновлення. У цьому посібнику це 01.01.2023.
- Натисніть OK, щоб застосувати.
- Виконайте ті самі дії, щоб додати параметр RangeEnd із датою або датою/часом, до якого Power BI має виконати поступове оновлення.
Тепер ви повинні мати три елементи в Power Query, як показано на зображенні нижче.
Тепер виберіть стовпець Дата та натисніть спадне меню. Клацніть опцію «Фільтри дати», а потім виберіть «Спеціальні фільтри» в додатковому меню.
У першому спадному меню виберіть «є після або дорівнює». Клацніть поле поруч із ним і виберіть параметр RangeStart.
Потім клацніть друге спадне меню та виберіть «передує або дорівнює» та додайте параметр RangeEnd.
Тепер просто натисніть кнопку «Закрити та застосувати» у верхньому лівому куті Power Query.
#3. Налаштування інкрементального оновлення в настільній програмі Power BI
У Power BI перейдіть до подання таблиці. Праворуч від таблиці набору даних клацніть правою кнопкою миші назву таблиці або набору даних, до якого потрібно застосувати функцію поступового оновлення. У контекстному меню натисніть Поступове оновлення.
Тепер виконайте наступне:
- Увімкніть інструмент «Установити діапазони імпорту та оновлення», пересунувши кнопку.
- Введіть значення для таких полів:
- Початок архівування даних
- Початок поступового оновлення даних
- Натисніть Застосувати.
#4. Публікація звіту
Тепер перейдіть до команди Головна > Опублікувати в блоці Поділитися. Натисніть Опублікувати.
Power BI попросить вас зберегти файл на вашому ПК. Робіть згідно з інструкцією.
Знову натисніть «Опублікувати», виберіть місце призначення, як-от «Моя робоча область», і натисніть «Вибрати».
Висновок
Отже, тепер ви знаєте, як скористатися функцією поступового оновлення Power BI, щоб завжди отримувати дані в реальному часі з серверів джерел даних без оновлення всіх даних і сплати величезних зборів за використання ресурсів хмарних обчислень. Ви також економите дорогоцінний час у процесі.
Виконайте наведені вище кроки та спробуйте поступове оновлення наступного разу, коли ви створюватимете та публікуєте звіти та інформаційні панелі з Power BI.
Далі Power BI: відмінності між звітом і інформаційною панеллю.