Вступний посібник із даних часових рядів

«Час» є важливою змінною, коли йдеться про накопичення даних. В аналізі часових рядів час є важливим елементом даних.

Що таке дані часових рядів?

Дані часових рядів стосуються серії точок даних, упорядкованих у часі. Він вводить порядкову залежність між набором спостережень. Часові ряди повсюдно поширені в сучасному світі, що керується даними. Оскільки кожна подія йде за стрілою часу, ми постійно взаємодіємо з різними даними часових рядів.

Зазвичай передбачається, що часові ряди створюються через регулярні проміжки часу, і їх називають регулярними часовими рядами. Однак дані в межах цього часового ряду не потрібно генерувати через регулярні проміжки часу. Такі випадки охоплюють нерегулярні часові ряди, де дані слідують за часовою поетапною послідовністю. Це означає, що вимірювання можуть відбуватися не через рівні проміжки часу. Однак дані можуть генеруватися через окремі проміжки часу або як пакет. Прикладами нерегулярних часових рядів є зняття з банкомату або поповнення рахунку.

Технічно в часовому ряді одна або кілька змінних змінюються протягом певного періоду часу. Якщо одна змінна змінюється з часом, її називають однофакторним часовим рядом. Наприклад, розглянемо датчик, який щосекунди вимірює температуру в кімнаті. Тут у кожен момент (тобто секунду) генерується лише одновимірне значення температури. Навпаки, коли більше ніж одна змінна змінюється з часом, це називається багатовимірним часовим рядом. Для прикладу розглянемо банківську економіку. У таких випадках багатофакторні часові ряди використовуються для розуміння того, як зміни в політиці однієї змінної, такої як ставка репо, можуть вплинути на інші змінні (тобто на виплату кредиту для комерційних банків).

Дані часових рядів знаходять своє застосування в кожній дисципліні, від фінансів, геології, метеорології, виробництва до обчислювальної техніки, Інтернету речей, фізичних і соціальних наук. Він використовується для відстеження змін погоди, народжуваності, смертності, коливань ринку, продуктивності мережі та багатьох інших програм. Деякі з основних випадків його використання включають моніторинг, прогнозування та виявлення аномалій. Наприклад, прогнозування часових рядів відіграє вирішальну роль у визначенні популярності систем керування базами даних. На малюнку нижче показано зростання популярності СУБД протягом багатьох років (2019-2021) на графіку часових рядів.

https://www.influxdata.com/time-series-database/

Ключові компоненти часових рядів

Фактори, які впливають на значення спостереження в часовому ряді, розглядаються як його ключові компоненти. Три категорії компонентів включають:

  • Тренд або довгострокові рухи
  • Короткочасні рухи
  • Сезонні коливання
  • Циклічні варіації
  • Випадкові або нерегулярні рухи
  • Тренд

    Тенденція збільшення або зменшення даних протягом тривалого періоду часу називається тенденцією або довгостроковою складовою. Однак важливо зазначити, що рух вгору чи вниз не обов’язково має бути в одному напрямку протягом заданого проміжку часу.

    Тенденції можуть зростати, знижуватися або залишатися стабільними протягом різних відрізків часу. Однак загальна тенденція завжди має відповідати висхідній, низхідній або стабільній моделі. Такі тенденції руху очевидні на таких прикладах, як продуктивність сільського господарства, рівень смертності, вироблені пристрої, кількість заводів тощо.

    Лінійний і нелінійний тренд

    Побудова графіка значень часового ряду в залежності від часу показує тип тенденції на основі моделі кластеризації даних. Якщо кластер даних є більш-менш навколо прямої лінії, тоді тенденція називається лінійною. В іншому випадку модель кластера даних демонструє нелінійну тенденцію, оскільки співвідношення змін між двома змінними не є стабільним або постійним. Тому такі тренди ще називають криволінійними кореляціями.

    Короткочасні рухи

    У часовому ряді ці компоненти мають тенденцію повторюватися протягом певного періоду часу. Вони мають нерегулярні короткі спалахи та впливають на досліджувані змінні. Короткострокове переміщення включає два типи категорій:

    Сезонні зміни

    Ці версії діють регулярно та періодично протягом періоду менше року. Вони, як правило, мають подібну або майже однакову картину протягом 12 місяців. Такі варіації стають частиною часового ряду, якщо дані записуються регулярно, тобто щогодини, щодня, щотижня, щомісяця чи щокварталу.

    Сезонні коливання викликані людиною або природним шляхом. Різні пори року або кліматичні умови відіграють вирішальну роль у таких варіаціях. Наприклад, рослинництво повністю залежить від сезонів. Подібним чином ринок парасольки чи плаща залежить від сезону дощів, тоді як продаж кулерів і кондиціонерів досягає піку в літній сезон.

    До рукотворних конвенцій належать фестивалі, вечірки та події, як-от весілля. Такі короткочасні події повторюються з року в рік.

      Як користуватися програмою iPhone Camera: остаточний посібник

    Циклічні варіації

    Варіації часових рядів, які, як правило, діють протягом періоду більше року, називаються циклічними варіаціями. Для бізнесу один повний період вважається «діловим циклом». Підвищення або зниження ефективності бізнесу залежить від різних факторів, таких як економічна структура, управління бізнесом та інші взаємодіючі сили. Ці циклічні ділові зміни можуть бути регулярними, але не періодичними. Загалом бізнес проходить чотириетапний циклічний процес, який включає процвітання, спад, депресію та пожвавлення.

    Такі циклічні коливання є невід’ємною частиною шаблону часових рядів, оскільки розвиток бізнесу значною мірою залежить від згенерованих «точок послідовних даних».

    Випадкові або нерегулярні рухи

    Випадкові компоненти викликають значну варіацію змінної, що спостерігається. Це суто нерегулярні коливання без будь-якої встановленої моделі. Сили є непередбачуваними, непередбачуваними та нестабільними за своєю природою — наприклад, землетруси, повені, голод та інші лиха.

    Випадкові події, описані вище, аналізуються з використанням вихідних даних часових рядів, щоб краще впоратися з реальними сценаріями, які можуть статися в майбутньому.

    Типи часових рядів

    Дані часових рядів можна розділити на чотири типи: детерміновані, недетерміновані, стаціонарні та нестаціонарні. Розглянемо кожен вид докладніше.

    #1. Детермінований часовий ряд

    Детермінований часовий ряд можна описати за допомогою аналітичного виразу. Він не включає випадкові чи ймовірнісні аспекти. Математично його можна точно виразити для всіх інтервалів часу в термінах розкладання в ряд Тейлора. Це можливо, якщо всі його похідні відомі в якийсь довільний момент часу. Ці похідні явно вказують минуле та майбутнє на той час. Якщо всі умови виконуються, можна точно передбачити його майбутню поведінку та проаналізувати, як він поводився в минулому.

    #2. Недетермінований часовий ряд

    Недетермінований часовий ряд має випадковий аспект, який перешкоджає його явному опису. Отже, аналітичні вирази не є достатньо можливим рішенням для вираження такого часового ряду. Часовий ряд може бути недетермінованим через такі причини:

  • Інформація, необхідна для його опису, недоступна в повному обсязі. Хоча в принципі дані можуть бути присутніми, їх не можна розглядати як такі, що піддаються кількісному виміру.
  • Процес генерування даних має випадковий характер.
  • Через випадковий фактор недетермінований часовий ряд підкоряється імовірнісним законам. Тому дані розглядаються в статистичних термінах – непрямі дані визначаються розподілами ймовірностей і середніми значеннями різних форм. Сюди входять середні та міри дисперсії, тобто дисперсії.

    #3. Стаціонарний часовий ряд

    У стаціонарних часових рядах статистичні властивості, такі як середнє значення, дисперсія та інші, не залежать від часового аспекту. Стаціонарний часовий ряд легше передбачити, оскільки можна з упевненістю стверджувати, що його статистичні властивості залишаться такими ж, як вони спостерігалися в минулому. Отже, різні статистичні методи прогнозування базуються на аргументі, що часовий ряд майже стаціонарний. Це означає, що часові ряди можна розглядати як стаціонарні в наближенні, застосовуючи прості математичні перетворення.

    #4. Нестаціонарний часовий ряд

    У нестаціонарному ряду статистичні властивості змінюються з часом. Таким чином, часові ряди з трендами або сезонністю підпадають під категорію нестаціонарних, оскільки тренд і сезонність можуть впливати на значення часових рядів у різні часові інтервали. Нестаціонарний часовий ряд описує непередбачувані дані, що перешкоджає їх моделюванню чи прогнозуванню.

    https://www.oreilly.com/library/view/hands-on-machine-learning/9781788992282/15c9cc40-bea2-4b75-902f-2e9739fec4ae.xhtml

    Аналіз часових рядів і прогнозування

    Аналіз часових рядів і прогнозування є зручними інструментами для спостереження, аналізу і вивчення еволюції і динаміки життєво важливих процесів і об’єктів різного роду. Давайте розглянемо кожен із них глибше.

    Аналіз часових рядів

    Аналіз часових рядів визначається як процес аналізу даних, зібраних за певний період часу. Тут аналітики даних записують дані через постійні інтервали протягом фіксованого періоду часу. Швидкість спостереження даних, тобто інтервал часу, може коливатися від секунд до років.

    Дані часових рядів описують змінні, що перевіряються, оскільки забезпечують детальний аналіз коливань за певний проміжок часу. Параметри, необхідні для аналізу, можуть відрізнятися в різних областях і дисциплінах. Деякі з прикладів можуть включати:

    • Наукові прилади – дані, що записуються за день
    • Комерційний сайт – кількість відвідувань за день
    • Фондовий ринок – вартість акцій за тиждень
    • Сезон – дощові дні в році

    Щоб забезпечити послідовність і надійність, аналіз часових рядів працює на великій кількості точок даних. Хороший розмір вибірки — це тонке уявлення про достовірність виявленої тенденції чи шаблону.

    Крім того, аналіз часових рядів також підходить для прогнозування майбутніх подій на основі минулих записаних даних.

    Прогнозування часових рядів

    Аналіз часових рядів дозволяє організаціям визначити першопричину коливань тенденцій з часом. Маючи під рукою дані, підприємства можуть далі вивчати та досліджувати, щоб краще зрозуміти, як боротися з незнайомими тенденціями та прогнозувати майбутні події. Компанії зазвичай використовують методи візуалізації даних, щоб визначити такі аномалії в даних.

      Посібник для локального SEO

    Прогнозування часових рядів обертається навколо двох важливих факторів:

  • Передбачте майбутні події на основі поведінки минулих даних.
  • Припустимо, що майбутні тенденції будуть мати подібність до моделі минулих даних.
  • Основна мета прогнозування полягає в тому, щоб передбачити, як точки даних залишатимуться незмінними або змінюватимуться в майбутньому. Ось кілька прикладів із різних галузей промисловості, щоб краще зрозуміти нюанси аналізу часових рядів і прогнозування.

    • Фондовий ринок – Щоденне прогнозування ціни акцій на момент закриття.
    • Продажі – прогнозуйте продажі товарів для магазину щодня.
    • Ціноутворення – прогнозування середньої ціни на паливо щодня.

    Деякі з поширених статистичних методів, які використовуються для прогнозування часових рядів, включають просте ковзне середнє (SMA), експоненціальне згладжування (SES), авторегресійне інтегроване ковзне середнє (ARIMA) і нейронну мережу (NN).

    Дані часових рядів у хмарі

    Щоб розкрити цінність даних часових рядів, підприємства повинні мати можливість швидко зберігати та запитувати дані. Компанії ринку капіталу покладаються на великі обсяги історичних і потокових даних, щоб використовувати аналітику даних у реальному часі та приймати ефективні бізнес-рішення. Це може включати прогнозування вразливості цін на акції, визначення вимог до чистого капіталу або прогнозування обмінних курсів. Щоб забезпечити гнучкість і безперебійну обробку даних, багато компаній обирають міграцію своїх баз даних часових рядів у хмару.

    Завдяки перенесенню баз даних часових рядів у хмари організації можуть отримати доступ до необмежених ресурсів за вимогою. Це дозволяє компаніям використовувати сотні ядер для виконання свого завдання, що максимізує пропускну здатність мережі без проблем із затримкою.

    Бази даних часових рядів у хмарній інфраструктурі підходять для інтенсивних обчислювальних навантажень. Це включає виконання розрахунків ризиків у відповідь на ринкові тенденції в реальному часі. Фінансові компанії можуть відмовитися від накладних витрат на центр обробки даних і зосередитися на використанні ресурсів для підвищення продуктивності своїх робочих навантажень.

    Хмарні постачальники, такі як AWS, надають Amazon Timestream, служба бази даних часових рядів, яка дозволяє легко завантажувати, зберігати та аналізувати набори даних часових рядів. Вони пропонують сховище для керування робочими навантаженнями, пов’язаними з інтенсивними транзакціями, інструменти аналізу в реальному часі та функцію потокового передавання даних для відображення подій, коли вони відбуваються.

    Отже, хмарна інфраструктура розширює та масштабує переваги даних часових рядів.

    Застосування часових рядів

    Моделі часових рядів служать двом цілям,

  • Зрозумійте чинники, що лежать в основі певної моделі даних.
  • На основі аналізу підберіть модель для прогнозування та моніторингу.
  • Давайте розглянемо деякі приклади використання даних часових рядів у програмі.

    #1. Часові ряди у сфері фінансів і бізнесу

    Усі фінансові, бізнесові та інвестиційні рішення приймаються на основі поточних тенденцій ринку та прогнозів попиту. Дані часових рядів використовуються для пояснення, кореляції та прогнозування динамічного фінансового ринку. Фінансові експерти можуть вивчати фінансові дані, щоб давати прогнози для програм, які допомагають зменшити ризики, стабілізувати ціни та торгівлю.

    Аналіз часових рядів відіграє ключову роль у фінансовому аналізі. Він використовується для прогнозування процентних ставок, прогнозування нестабільності на фондових ринках і багато іншого. Зацікавлені сторони бізнесу та політики можуть приймати обґрунтовані рішення щодо виробництва, закупівель, розподілу ресурсів і оптимізувати свої бізнес-операції.

    Цей аналіз ефективно використовується в інвестиційному секторі для моніторингу ставок безпеки та їх коливань у часі. Ціна безпеки також може спостерігатися в короткостроковій перспективі (тобто записувати дані за годину або день) або довгостроково (тобто спостереження розтягнуте на місяці або роки). Аналіз часових рядів є корисним інструментом для відстеження ефективності безпеки, активу чи економічної змінної протягом тривалого періоду часу.

    #2. Часові ряди в медичній сфері

    Охорона здоров’я швидко стає галуззю, що керується даними. Окрім фінансового та бізнес-аналізу, сфера медицини значною мірою використовує аналіз часових рядів.

    Розглянемо сценарій, який потребує синергії даних часових рядів, узгоджених з медичною точки зору процедур і методів інтелектуального аналізу даних під час лікування хворих на рак. Така гібридна структура може бути використана для використання функціональних можливостей вилучення ознак із зібраних даних часового ряду (тобто рентгенівських зображень пацієнта) для відстеження прогресу пацієнта та відповіді на лікування, яке надає медичне братство.

      Як змінити папку закладок за замовчуванням у Firefox

    У секторі охорони здоров’я отримання висновків із даних часових рядів, що постійно змінюються, є критично важливим. Крім того, передові медичні практики вимагають, щоб записи пацієнтів з часом з’єднувалися для кращої видимості стану здоров’я пацієнта. Крім того, параметри здоров’я пацієнта повинні точно реєструватися через регулярні проміжки часу, щоб мати більш чітке уявлення про стан здоров’я пацієнта.

    З появою передових медичних інструментів аналіз часових рядів зарекомендував себе в галузі охорони здоров’я. Розгляньте наведені нижче приклади,

    • Пристрої ЕКГ: пристрої, винайдені для моніторингу стану серця шляхом реєстрації електричних імпульсів серця.
    • ЕЕГ пристрої: пристрої, що використовуються для кількісного визначення електричної активності в мозку.

    Такі пристрої дозволили практикуючим лікарям проводити аналіз часових рядів для швидшої, ефективної та точної діагностики.

    Крім того, з появою пристроїв Інтернету речей, таких як переносні датчики та портативні медичні пристрої, люди тепер можуть проводити регулярні вимірювання змінних свого здоров’я з часом з мінімальними вхідними даними. Це призводить до узгодженого збору залежних від часу медичних даних як для хворих, так і для здорових людей.

    #3. Часові ряди в астрономії

    Астрономія та астрофізика — це дві сучасні дисципліни, у яких значною мірою використовуються дані часових рядів.

    По суті, астрономія передбачає побудову траєкторій космічних об’єктів і небесних тіл і виконання точних вимірювань для кращого розуміння Всесвіту за межами земної атмосфери. Завдяки цій вимогі астрономічні експерти вміють працювати з даними часових рядів під час калібрування та налаштування складних інструментів і вивчення цікавих астрономічних об’єктів.

    Дані часових рядів давно асоціюються з галуззю астрономії. У 800 році до нашої ери дані про часові ряди сонячних плям збиралися через регулярні проміжки часу. З тих пір використовувався аналіз часових рядів

    • Відкривайте далекі зірки на основі зоряних відстаней,
    • Спостерігайте за космічними подіями, такими як наднові, щоб краще зрозуміти походження нашого Всесвіту.

    Дані часових рядів у цьому випадку стосуються довжин хвиль та інтенсивності світла, що випромінюється зірками, небесними тілами чи об’єктами. Астрономи постійно відстежують такі потокові дані, щоб виявляти космічні події в реальному часі, коли вони відбуваються.

    Останнім часом з’явилися такі галузі досліджень, як астроінформатика та астростатистика, які поєднують різні дисципліни, такі як інтелектуальний аналіз даних, машинне навчання, обчислювальний інтелект і статистика. У цих нових сферах досліджень роль даних часових рядів полягає у швидкому та ефективному виявленні та класифікації астрономічних об’єктів.

    #4. Часові ряди в прогнозуванні погоди

    Аристотель ретельно вивчав погодні умови, щоб краще зрозуміти причини та наслідки змін погоди в стародавні часи. З плином днів вчені почали записувати дані про погоду за допомогою таких інструментів, як «барометр», для обчислення атмосферних змінних. Дані збиралися через регулярні проміжки часу та зберігалися в різних місцях.

    З часом прогнози погоди почали з’являтися в газетах. Повертаємося до сьогоднішнього дня та епохи: повсюдні станції прогнозування погоди встановлені в різних географічних регіонах світу для збору точних погодних змінних.

    Такі станції мають передові функціональні пристрої, які взаємопов’язані для збору та кореляції даних про погоду з різних місць. Корельовані дані використовуються для прогнозування погодних умов кожного разу залежно від вимог.

    #5. Часові ряди розвитку бізнесу

    Дані часових рядів дозволяють підприємствам приймати бізнес-рішення. Це досягається завдяки тому, що процес аналізує минулі дані, щоб вивести майбутні події та пролити світло на ймовірні можливості. Шаблон минулих даних використовується для отримання таких параметрів:

    • Зростання бізнесу: для оцінки загальних фінансових і ділових показників і вимірювання зростання дані часових рядів є найбільш підходящим і надійним активом.
    • Оцінити тенденцію: для оцінки нових тенденцій можна використовувати різні методи часових рядів. Розглянемо, наприклад, ці методи аналізу даних спостережень за певний період часу, щоб відобразити збільшення чи зменшення продажів певного електронного пристрою.
    • Відкрийте сезонні закономірності: записані точки даних можуть виявити коливання та сезонні закономірності, які можуть допомогти у прогнозуванні даних. Отримана інформація відіграє ключову роль для ринків, де ціни на товари коливаються сезонно. Такі дані можуть допомогти підприємствам у кращому плануванні та розробці продукції.

    Висновок 👨‍🏫

    Таким чином, дані часових рядів можна розглядати як характеристики складних точок даних, зібраних протягом постійного періоду часу. Аналіз часових рядів, моделювання та прогнозування стали невід’ємною частиною нашого повсякденного життя з появою гаджетів IoT, розумної побутової техніки та портативних пристроїв. Крім того, дані часових рядів знаходять своє застосування в різноманітних сферах, включаючи охорону здоров’я, астрофізику, економіку, інженерію, бізнес та багато інших.