Якщо чоловік, вік якого від 30 до 35 років, викладає на стрічку супермаркету пиво, а також снеки в широкому асортименті, можна припустити, що сьогодні він збирається подивитися цікаву спортивну трансляцію.
Спираючись на такі припущення, маркетологи можуть сформулювати завдання з аналізу ринкового кошика. Мета цього заходу — виявити серед покупок клієнтів супермаркету комбінації товарів, які пов’язані між собою. Тобто зрозуміти, чи насправді поєднання пива та чіпсів є шаблонним, чи це випадковість.
Це завдання можна сформулювати так: виявити залежність (асоціативне правило) вигляду “якщо в транзакції є набір елементів А, то набір елементів Б з певною вірогідністю теж у ній буде”.
Цю інформацію можна отримати з бази даних із чеками. Приймемо, що чек — це транзакція, а товари — елементи. Аналізуючи, ми виявили таке асоціативне правило:
Може здатися, що це очевидно. У принципі, про це можна здогадатися інтуїтивно, але оцифровані дані є незаперечним фактом. Саме цифри дають змогу проводити маркетингові акції, спрямовані на стимулювання продажів солоних закусок, а ще — зрозуміти, наскільки вона буде вигідною і яким має бути формат акційної пропозиції.
Треба розуміти, що очевидні правила зазвичай високо достовірні та мають високу підтримку. А от правилами, які високо достовірні, але не мають високої підтримки, можна користуватися, щоб знайти ідеї для акцій, наприклад, набори товарів для промо-пропозицій.
Приміром, можна дізнатися, що пиво в скляній тарі частіше купують із вином, білим чи червоним, або іншим алкоголем, а зовсім не з чіпсами і сухариками.
Спочатку завдання ставилося тільки на аналіз споживчого кошика в супермаркеті, але якщо сформулювати його в більш узагальненому вигляді, то виявлені асоціативні правила можна використовувати в інших сферах.
Наприклад, у страховому бізнесі на базі аналізу вже укладених договорів можна сформувати новий продуктовий ряд. У ньому можуть бути розширені пропозиції, преміальні послуги.
Ті ж автодилери, аналізуючи чеки, можуть створювати пакетні пропозиції для автомобілістів. Щоб отримати для себе максимальну вигоду, можна об’єднувати в рамках однієї пропозиції популярні послуги і ті, які приносять найбільше прибутку.
Є й практичний кейс роботи з оператором мобільного зв’язку. З’ясували, що є найпоширеніші значення послуг, якими користуються деякі клієнти. Вони виглядають, наприклад, так:
Цілком раціонально виглядає припущення, що такі абоненти — туристи з інших країн, які купують сім-карти, щоб користуватися зв’язком дешевше.
Підсумуємо: шаблони можна шукати у відповідях на запитання анкет, створювати пропозиції для крос-продажів в інтернет-магазинах. Тобто, маючи транзакції та елементи, можна шукати правила об’єднання елементів у множині.
Підкріпимо описане вище візуалізацією. Почнемо з діаграми частоти покупок товарів.

Найчастіше купують молоко, його в загальному масиві чеків понад 25%. Також популярні такі товари (їх у чеках від 15 до 20%):
Тобто логічно припустити, що в правилах, які ми виводимо, ці товари теж будуть.
На діаграмі нижче бачимо, що найчастіше клієнти з кластера №2 купують цукор-пісок у мішках по 50 кг. А ось клієнти з кластерів №1 і №4 цей товар купують не так уже й часто. Отже, варто використовувати цю інформацію, роблячи пропозиції клієнтам. Зрозуміло, що не варто витрачати ресурси, пропонуючи всім клієнтам товар, цікавий тільки одній групі.

Також можна шукати не тільки окремі продукти, а й набори, що складаються з декількох товарів, які найчастіше купують разом.
Наприклад, у клієнтів із кластера №4 банани і яйця є в одному чеку досить часто. Але ця група за чисельністю — не більше 10% від усієї бази клієнтів, щоправда, приносить близько 65% доходу. Відповідно, не варто проводити акцію з цими товарами, розраховану на клієнтів із кластера №2.

Повернемося до асоціативних правил. Використовуючи алгоритм apriori, знайдемо список правил. Умови для відбору будуть такими:
Залежно від кількості товарів у чеку можна видаляти непотрібні або очевидні правила.
Спираючись на параметри, задані нами, алгоритм видав 5668 правил. В Excel отримуємо таку таблицю:

У першій колонці знаходяться наші правила, а далі — їхні характеристики. Виходить, що найчастіше купують набір продуктів з овочів, йогурту та молока.
Будуємо кілька діаграм із розподілом асоціативних правил за кількістю наборів продуктів. Далі досліджуємо графіки, щоб виділити групи асоціативних правил для подальшого аналізу.
На графіку нижче ми маємо групу правил у лівому верхньому кутку. Її достовірність дорівнює 1.

Правила зустрічаються не надто часто, але вони є. Не виключено, що це одні й ті самі покупці, тобто їм можна запропонувати щось у вигляді вираження турботи. Ось, що це за правила.

Бачимо, що є клієнти, які постійно купують такий набір: “{cream cheese ,domestic eggs,sugar} => {whole milk}”. З нього можна приготувати сирно-кремовий десерт. Щоб подякувати людині, яка купила цей набір 11 разів, можна подарувати їй майстер-клас від фахівця з десертів або 12-й набір безкоштовно. Також можна цей набір красиво упакувати, додати фото, рецепт і провести акцію під назвою “Рецепт тижня”, щоб цей набір купували й інші люди.
Виходить, що акції, створені на основі аналізу даних, мають усі шанси бути більш успішними, ніж ті, що сформовані на основі домислів.
Є й інші корисні знання, які можна отримати з чеків.
Наприклад, побудуємо таку матрицю:

Із правої частини RHS бачимо такий перелік товарів:
У великій кількості наборів трапляється молоко, а от пиво в пляшках у комплекті купують значно рідше, але значення показника lift для цього набору справді велике.
Отже, у наборах ці товари купують частіше, ніж окремо. Тому логічно працювати з акційними пропозиціями на товари з цього набору.
Щоб розібратися в отриманих результатах, побудуємо ще одну діаграму.

Тут видно, що пиво в пляшках лише в одному правилі фігурує з вином та іншим алкоголем. А ось тропічні фрукти є у двох правилах: з шинкою, виноградом і ще п’ятьма продуктами. Їх можна об’єднати з набором із першого правила й отримати комбінацію для вечірки.
Також для аналізу можна використовувати графи. Вони допоможуть розібратися у зв’язках між продуктами та правилами.
Кожне правило на графі — вершина (точка), а вхідні ребра — “ліва частина” правила. “Права частина” правила зображена на вихідних ребрах. Розміри точки — ліфт, а рівень підтримки позначений кольором.
Виділене синім правило показує, що клієнти, які купують газовану воду і попкорн, найімовірніше придбають інші солоні снеки.

Правило, яке не пов’язане з іншими, добре помітне на графі, воно виділене жовтим. Схоже, що це набір для випічки. Він цілком може стати акційним.
Серед способів візуалізації правил є й такий, як паралельні координати.
Якщо взяти ТОП-10 правил, де найбільший параметр lift, і відобразити їх на графіку, то отримаємо таку картинку. У крайній правій колонці RHS ми бачимо продукти з “правої частини” правила. Через позиції “лівої частини” правила проходить стрілка, її довжина — кількість позицій у правилі, а товщина — рівень підтримки.

Підіб’ємо підсумок. Ми розібралися в тому, як можна використовувати для пошуку шаблонів асоціативні правила. Для наочності ми використовували вже готові дані, але для реального супермаркету, асортимент якого налічує тисячі товарів, діаграми будуть набагато масштабнішими. А підхід у цілому все одно залишається робочим.
