Аналіз даних є процесом, де статистичні або логічні прийоми застосовуються для інтерпретації та оцінки інформації.
Цей вид аналізу включає в себе детальне узагальнення даних, яке згодом використовується для формування та представлення остаточних результатів. Метою є донесення ключових висновків або можливих варіантів дій.
Однак, для успішного аналізу необхідно чітко розрізняти зібрані дані. Для полегшення цього процесу важливо мати розуміння двох основних методологій: якісних та кількісних даних.
Якісні та кількісні дані – це результати спостережень, підтверджень та збору інформації, які можуть бути представлені у різних формах.
Інформація може існувати у вигляді чисел, фактів, вимірювань, записів, блокнотів, відео, зображень та інших форматів, як цифрових, так і нецифрових.
Між цими двома типами даних існують суттєві відмінності. Щоб правильно обрати потрібний тип для конкретного проєкту, потрібно чітко розуміти їх особливості та відмінності.
Давайте розглянемо, що саме відрізняє якісні дані від кількісних.
Якісні та кількісні дані: у чому їхня суть?
Для глибшого розуміння цих термінів, спочатку потрібно звернути увагу на те, що перший тип даних є інтерпретаційним, дослідницьким та суб’єктивним, тоді як другий є переконливим, об’єктивним і заснованим на вимірюваннях.
Якісні дані
Якісні дані – це інформація, яку неможливо виміряти, виразити в числах або підрахувати. Інформація збирається з аудіо, зображень, текстових матеріалів та інших джерел, а потім подається за допомогою візуальних інструментів, таких як концептуальні карти, часові шкали, інфографіка тощо.
Наприклад, якщо користувач відвідує вебсайт і додає товари до кошика, але залишає його без покупки, важливо дослідити «чому» і «як». Наприклад, чому відвідувач покинув кошик і які його враження від сайту чи продуктів. Тут на перший план виходить «якість», тому необхідно отримувати інформацію з якісних даних.
У наведеному прикладі немає потреби в конкретних цифрах, щоб зрозуміти причину такої поведінки користувача. Необхідно звернутися до нього, щоб дізнатися його думку та досвід. Іншими словами, якісні дані – це мітка або термін, який використовується для опису характеристик певних речей. Наприклад, смак морозива як шоколадний або колір моря як синій.
Якісні дані мають нестатистичну форму та зазвичай є напівструктурованими або неструктурованими. Це означає, що немає необхідності отримувати чіткі числові значення за допомогою графіків та діаграм. Вони характеризуються формою, мітками, атрибутами, властивостями та іншими ідентифікаторами.
Такі дані можна зібрати за допомогою документів, текстів, відеозаписів, аудіозаписів, фокус-груп, стенограм інтерв’ю, нотаток та спостережень. Варто зазначити, що ідентифікаційні номери, такі як номери водійських прав або соціального страхування, також є якісними даними, оскільки вони є унікальними та категоричними для кожної особи.
Приклади: золотисті ручки, гладка поверхня, темно-коричневий колір, смак американського горіха, виробництво в Італії, зелені сорочки, блакитний океан, гарні малюнки тощо.
Кількісні дані
Кількісні дані – це інформація, яку можна виміряти або підрахувати в числових значеннях. Це будь-які дані, які можна виразити кількісно, і які дослідники використовують для статистичного аналізу та математичних розрахунків з метою прийняття обґрунтованих рішень на основі отриманих результатів.
Цей тип даних допомагає відповісти на питання “скільки?”, “як часто?” і “яка кількість?”. Кількісні дані можна легко перевірити та оцінити за допомогою математичних методів. Наприклад:
Клієнт запитує продавця: “Яка ціна цього принтера?”
Це кількісне питання, яке дозволяє отримати дані, такі як ціни на різні пристрої. Значення пов’язані з вимірюваними параметрами, такими як кілограми для ваги, долари для вартості тощо.
Кількісні дані збираються для статистичного аналізу за допомогою опитувань, анкет та інструментів подібного роду. Іншими словами, інформація, яку можна виразити числово, є кількісними даними. Вони є структурованими і можуть бути розраховані за допомогою статистичних методів, що робить їх визначеними та точними.
Кількісні дані зазвичай є більш закритими та лаконічними, і їх можна отримати за допомогою тестів, опитувань, експериментів, показників, аналізу ринкових звітів тощо.
Приклади: вага в кілограмах, кількість тижнів у місяці, зріст у дюймах або футах, відстань у кілометрах або милях, вік у роках або місяцях, дохід у доларах, довжина в сантиметрах тощо.
Якісні та кількісні дані: відмінності
Обидва типи даних є важливими у кожній галузі. Щоб краще зрозуміти їх, необхідно розглянути відмінності за їхніми критеріями, функціями, природою тощо.
Розглянемо деякі з основних відмінностей:
- Дані, в яких класифікація об’єктів залежить від якості або атрибутів, є якісними. На противагу, дані, які можна порахувати або виразити в числах, є кількісними.
- Якісні дані ґрунтуються на розумінні між людьми, емоціях, кольорі тощо. З іншого боку, кількісні дані ґрунтуються на значеннях, які дають статистичні результати для прийняття рішень.
- Якісні дані збирають інформацію у словесній формі, тоді як кількісні дані – у вимірювальній.
- Якісні дані дають початкове розуміння, а кількісні – пропонують остаточні дії.
Ми вже розглянули основні концепції обох типів даних. Тепер розглянемо ключові відмінності між ними.
Отже:
Критерії | Якісні дані | Кількісні дані |
Визначення | Якісний аналіз даних – це метод, що застосовується для розуміння соціальних та гуманітарних аспектів. | Кількісний аналіз даних – це методика, що застосовується для отримання точних фактів та числової інформації за допомогою логічних та математичних методів. |
Дані | Містять такі дані, як релігія, національність, колір, смак, стать тощо. | Містять вагу, масу, розмір, зріст, ціну тощо. |
Підхід | Суб’єктивний аналіз з використанням нестатистичних даних, які неможливо обчислити. | Об’єктивний аналіз, який можна обчислити за допомогою математичних методів. |
Аналіз | Розглядає питання: чому відбуваються певні події, які почуття викликає продукт у користувача, чому кошик покупок був залишений тощо. | Аналіз тут пояснює кількість або частоту подій, наприклад, частоту залишення кошика покупок. |
Зразок | Нерепрезентативний і невеликий. | Великий, який можна узагальнити. |
Методи збору | Збір за допомогою письмових документів, інтерв’ю, спостережень. | Збір за допомогою експериментів, інтерв’ю, спостережень, опитувань. |
Тип даних | Текстові дані. | Числові дані. |
Результати | Результати узагальнюються для аналізу або просто передаються. | Результати представлені у вигляді графіків та діаграм. |
Елементи | Слова, предмети, малюнки тощо. | Числова та графічна інформація. |
Приклади з життя
Приклад 1: (Офісний простір)
Офісний простір можна проаналізувати, використовуючи обидва типи даних, залежно від функцій кожного елемента.
Якісні дані
- Великий та просторий
- Чудове природне освітлення
- Велика комора
- Фонтан з прохолодною водою
- Привабливі кольори стін
- Гарні рамки для картин
- Великий простір для ігор
Кількісні дані
- 12000 квадратних футів площі
- Кількість поверхів
- Кількість вікон
- Кількість дверей
- Кількість світлодіодів
- Кількість систем
Приклад 2: (Стаття на сайті)
Якісні дані
- Характер статті
- Якість статті, включаючи правопис, граматику, пунктуацію
- Реакція читачів
- Повнота опису теми
- Якість відео та аудіо матеріалів
Кількісні дані
- Кількість слів
- Кількість зображень
- Залучення, наприклад, коментарі, перегляди сторінок
- Час завантаження
- Кількість потенційних клієнтів
Приклад 3: (Територія університету)
Якісні дані
- Великі і густі дерева
- Яскраві кольори
- Сучасна архітектура
- Розумні світильники та вентилятори
- Великі класи
- Сучасні проектори
- Якісні книги
Кількісні дані
- Кількість аудиторій
- Кількість будівель
- Кількість вентиляційних отворів
- Площа паркувального простору в квадратних метрах
- Розмір класної кімнати
- Кількість лавок
- Кількість поверхів
Якісні та кількісні дані: види
Типи якісних даних
Статисти та дослідники поділяють якісні дані на три основні категорії:
- Бінарні дані: коли об’єкт визначається як хороший чи поганий, твердий чи м’який, правильний чи неправильний, свіжий чи несвіжий, це називається бінарними даними. Тобто, це якісні дані, які можна охарактеризувати за допомогою взаємовиключних ознак, що означає, що вони не можуть існувати одночасно. Статистики використовують ці дані для створення моделі, яка передбачає природу об’єкта.
- Номінальні дані: також відомі як мічені, номінальні шкали або іменовані дані. Це тип даних, який використовується для називання чогось без зазначення числового значення.
Наприклад, якщо є група предметів за кольорами, кожен предмет можна позначити відповідним кольором. Дослідники використовують ці номінальні дані для розрізнення набору інформації, наприклад, кольору. Такий тип даних також використовується для створення опитування з кількома варіантами відповідей для визначення найкращого.
- Порядкові дані: це тип якісних даних, класифікованих за певною шкалою або порядком. Це важливий крок у процесі збору даних.
Наприклад, коли респондент вказує свій рівень задоволення від послуги за шкалою від 1 до 10, він збирає дані відповідно до введеної інформації. Тут немає стандартної шкали для вимірювання різниці між кожною оцінкою. Деякі приклади – шкала Лайкерта, інтервальна шкала тощо.
Типи кількісних даних
Кількісні дані поділяються на два основні типи – дискретні та неперервні дані. Розглянемо їх детальніше.
Дискретні дані
Дискретні дані – це тип кількісних даних, що містять тільки підрахунок чисел. Вони не стосуються вимірювань, таких як довжина, вага, зріст тощо.
Наприклад, кількість учнів, кількість днів, кількість вентиляторів, вік людини тощо.
Під час визначення дискретних даних слід задати кілька питань, щоб їх диференціювати:
- Чи можна порахувати?
- Чи можна розділити?
- Чи можна це виміряти?
Дискретні дані також називають атрибутивними, які не можна поділити на менші частини. Вони можуть бути або скінченними, або нескінченними.
Приклад: зліченно скінченні дані — це довільна множина A = {1,2,3,4,….,n; де n — число, менше нескінченності}. Зліченно нескінченні дані – це довільна множина B = { 1,2,3,….}.
Неперервні дані
Це кількісний тип даних, який можна розмістити на шкалі вимірювання, тобто вони приймають числові значення, які можна поділити на менші частини. Неперервні дані можуть бути скінченними та нескінченними.
Наприклад, середній бал студентів вимірюється за 10-бальною шкалою. Студент може отримати від 0 до 10 балів, включаючи 8,5, 1,57, 4,65, 2,68, 9,8 тощо. Ці дані класифікуються як зліченно скінченні, оскільки мають верхню та нижню межі.
Аналогічно, прикладом незліченних нескінченних даних є набір дійсних чисел, R = {….,-1,0,1,….}. У цьому випадку дані не мають ні верхньої, ні нижньої межі.
Неперервні дані поділяються на два типи:
Інтервальні дані – це метод, за яким вимірювання проводиться за шкалою, де кожна точка розташована на однаковій відстані одна від одної. Дані відношення є розширенням інтервальних даних. Цей тип найбільш корисний для точного вимірювання даних. Дані відношення вказують на порядок, точну відстань тощо.
Способи отримання якісних та кількісних даних
Перш ніж розглянути різні методи збору якісних та кількісних даних, розглянемо типи збору даних.
Методи збору даних включають:
- Опитування, анкети та вікторини
- Інтерв’ю
- Фокус-групи
- Безпосередні спостереження
- Документи
Методи збору даних можна поділити на кількісні та якісні.
Якісні методи збору даних
- Анкети та відкриті опитування: це поширений метод збору даних за допомогою різних анкет та відкритих опитувань. Він дозволяє респондентам надавати відповіді у більш гнучкій формі. Не має попередньо визначених відповідей, що дозволяє користувачеві вільно писати.
- Індивідуальні інтерв’ю: це особисті інтерв’ю, що використовуються для збору якісних даних. Тут можна легко зібрати дані за допомогою інтерв’ю. Цей метод особливо корисний, коли потрібно зібрати персоналізовані дані.
- Фокус-групи: це також метод інтерв’ю, але замість індивідуальних, тут проводиться групова дискусія. За умови достатнього фінансування, часу та ресурсів, це дуже зручний метод.
Наприклад, якщо проводиться дослідження з реабілітації підлітків-наркоманів, то всі учасники групи повинні бути підлітками, які одужують від наркотичної залежності. - Пряме спостереження: це пасивний спосіб збору даних. Збирач даних займає місце учасника, уважно спостерігає за ситуацією, записує аудіо чи відео, а також робить фотографії. Цей метод має певну суб’єктивність через безпосереднє спостереження.
Методи збору кількісних даних
- Онлайн-вікторини та закриті опитування: цей метод базується на запитаннях, що дозволяють респондентам вибирати з варіантів. Він поділяється на два типи – категоріальні та інтервальні.
Категоріальні питання можуть бути дихотомічними (так чи ні), запитаннями з прапорцями та запитаннями з кількома варіантами відповідей. Інтервальні запитання складаються зі шкали Лайкерта, матричних питань, рейтингових шкал тощо.
Переваги кількісних даних над якісними
Кількісні дані мають багато переваг перед якісними, оскільки їх легше виміряти та представити у вигляді діаграми або звіту. Цей процес займає менше часу порівняно з якісними даними. Цей метод застосовується, коли немає чіткого уявлення про очікувані результати.
Переваги кількісних даних над якісними:
- Більш науковий підхід
- Контроль
- Менша суб’єктивність
- Фокусованість
- Можливість роботи з великими вибірками
- Простий метод аналізу
- Можливість повторення
- Відносна точність
- Структурованість
- Узагальнення
- Послідовність
- Швидкість та економія часу
- Користь для прийняття рішень
- Висока надійність даних
- Доступність
- Можливість використання випадкових вибірок
- Відсутність потреби у безпосередньому спостереженні
Висновок
Якісні дані складніше аналізувати порівняно з кількісними. Вони використовують загальні підходи, такі як якісний аналіз контенту, тематичний аналіз та аналіз дискурсу. Кількісні дані базуються на числах або значеннях, що дозволяє використовувати такі програми, як SPSS, R або Excel, для обчислень. Результати подаються у вигляді таблиць або графіків.
Сподіваємося, що ця публікація допомогла вам зрозуміти відмінності між якісними та кількісними даними і як їх використовувати в різних ситуаціях.