Незважаючи на різноманіття сучасного світу, є одна ключова навичка, котра важлива для спеціалістів різних галузей. Це — грамотність даних.
Коли ми говоримо про цифрову трансформацію, то багато в чому вона залежить від рівня інформаційної грамотності команди. Вона допомагає на максимум зрозуміти та використати той потенціал, що закладений у технології та процеси, засновані на даних.
Отже, HR-фахівцям та рекрутерам потрібно розуміти, що містить у собі визначення “грамотність даних”. Крім того, ці спеціалісти мають розуміти, який показник грамотності даних є мінімально припустимим для людини, яку наймають. Це розуміння допоможе правильно будувати програми підвищення кваліфікації для команди, а також коректно формулювати вимоги до людей, що будуть найняті після цифрової трансформації.
Статистика. Компанія Gartner щороку проводить опитування директорів з управління даними. В рамках цього дослідження було визначено, що низький рівень грамотності у роботі з даними є другою за значенням внутрішньою перешкодою до успіху офісу CDO. Саме тому грамотність даних включена у понад 80% стратегій управління даними та аналітикою, програм управління змінами.
Можна сказати, що грамотність роботи з даними — суперсила для сучасного спеціаліста. Саме від неї залежить здатність розуміти дані та інтерпретувати їх. Проведемо аналогію: вміння писати і читати є обов’язковими для будь-якої сучасної людини, а вже скоро таким самим стане грамотність даних.
Інформація = дані. Тобто дані оточують будь-якого співробітника: інформація про продажі, товарні залишки, ринкові показники тощо. Люди, які є інформаційно грамотними, зазвичай вирізняються наступним:
“Читаю та перекладаю зі словником” — приблизно так можна охарактеризувати мінімальний рівень грамотності при роботі з даними.
Працівник, який має базовий рівень грамотності при роботі з даними, вміє наступне.
1) Розуміє дані не просто в форматі констатації цифр та фактів, а вміє розрізняти види даних, наприклад, структуровані від неструктурованих.
Тобто людина знає, що структуровані дані організовані у певний спосіб, наприклад, як таблиці або бази даних. Крім того, працівник може фільтрувати, групувати дані, розуміти базові типи даних, відрізняти дати від строкових даних.
Також працівник може працювати з неструктурованими даними: текстами, картинками, постами у соцмережах тощо. Наприклад, йому під силу виокремити цінну інформацію з неструктурованих даних.
Ще грамотний співробітник володіє різними методами обробки даних та розуміє, коли й який слід застосувати. Наприклад, структуровані дані потребують статистичного аналізу чи агрегації даних, а от неструктуровані дані логічно обробити через розпізнавання зображень чи метод обробки природної мови.
2) Може забезпечити якість даних. Тобто дати такий рівень інформації, котрий дає змогу приймати зважені рішення.
Грамотна людина в змозі побачити в даних помилки різних типів (пропущені значення, дублі, неточності). Крім того, співробітник має розуміти потенційний вплив тієї чи іншої помилки на кінцевий результат.
Коли грамотний співробітник готує дані для аналізу, він бачить прогалини, розуміє, як їх заповнити та зібрати відсутню інформацію. Якщо отримати дані неможливо, людина знає, як скористатися інтерполяцією, імпутацією даних (імпутація середнього значення, регресійна імпутація тощо).
Також потрібно вчасно виявляти та обробляти аномальні або викидові значення, котрі можуть викривити результати аналізу.
3) Володіє основами аналізу. Тобто знає основні статистичні концепції та правила їх застосування.
Наприклад, грамотна людина знає різницю між середнім значенням та медіаною. Отже, такий співробітник знає, що медіана — показник надійніший і добре підходить для асиметричного розподілу даних.
Також грамотний спеціаліст розуміє обмеження у використанні середніх в аналізі, адже ті можуть викривляти результати при екстремальних значеннях або ненормальних розподілах.
Ще один важливий нюанс — робота з обмеженнями прямих і зворотних операцій з відсотками. Слід, наприклад, знати, що збільшення на 50% не є компенсацією зменшення на 50%.
4) Розуміє динаміку малих початкових баз або нуля.
Ті, хто працює з даними, повинні орієнтуватися у специфіці динаміки, пов’язаній з малими початковим базами чи нульовими значеннями. Особливо важливо це при роботі з відсотками та темпами зростання. Тут слід розуміти, що за умови невеликого початкового значення (бази) незначна абсолютна зміна дає велику зміну у відсотках.
Коли ж початкова база нульова, то відсоткову зміну вирахувати неможливо, вона стає невизначеною або нескінченною.
Такі знання дозволяють точно пояснювати відсоткові зміни і стверджувати, що аналіз відповідає контексту. Крім того, вони підкреслюють значення розгляду абсолютних значень у відповідності до відсотків, це дозволяє бачити розгорнуту картину тенденцій даних.
5) Працює з кореляцією та причинно-наслідковими зв’язками.
Слід розуміти кореляцію — статистичний взаємозв’язок між двома та більше змінними, тобто ступінь, до якого зміни між змінними пов’язані між собою.
Не менш важливо виділяти хибні кореляції, коли між змінними нема причинно-наслідкового зв’язку, і не робити необдуманих висновків.
Також має значення розуміння того, що кореляція не є синонімом причинно-наслідкового зв’язку. Тобто, навіть якщо змінні корелюють, це не означає, що зміни в одній змінній обов’язково ведуть до змін іншої.
6) Вміє візуалізувати щоб покращити комунікацію та сприйняття даних.
Важливо розуміти, коли доцільно використати той чи інший тип діаграми:
Також слід розумно використовувати кольори. Наприклад, відмовитися від великої кількості кольорів та відтінків, показувати особливо важливі моменти акцентами.
Тож, тепер ви знаєте, що таке рівень грамотності при роботі з даними. Це допоможе обрати в команду достатньо кваліфікованих співробітників, які допоможуть вийти на новий рівень у прийнятті рішень.
