Об'єднання даних Universal Analytics та Google Analytics 4 для АНЦ
КЛІЄНТ
Мережа аптек АНЦ — прогресивна аптека в питаннях якості обслуговування та технічних інновацій. Наразі мережа аптек під брендами Аптека АНЦ, Копійка, ШАР@ — є найбільшою в країні та включає 1100 аптек у 140 містах України.
ЗАДАЧА
• Розвʼязати проблему з семплінгом даних у Google Analytics 4.
- Об’єднати дані GA3 з GA4 в одному звіті.
- Побудувати кастомну атрибуцію «last non-push non-direct click».
Проблема клієнта
До початку нашої роботи в АНЦ вже була налаштована Google Analytics 4, але під час її використання вони зіткнулись з проблемою семплінгу даних при виборі певного періоду.
Проблема семплінгу даних знайома бізнесам, які використовують різні диджитал-канали просування та мають великий асортимент товарів чи послуг.
Семплінг даних у Google Analytics 4 означає використання вибіркових даних замість повного набору даних для аналізу. Зазвичай ми пояснюємо цей термін на прикладі яблуневого саду. Уявіть, що там росте 100 яблунь. Щоб порахувати вражай, можна окремо порахувати яблука на всіх 100 яблунях, а можна порахувати на 10-ти — і кількість помножити на 10. Значення буде приблизне, але результат ви отримаєте вдесятеро швидше. Це і є семплінг.
Для оптимізації своїх потужностей Google аналізує вибіркові дані, це впливає на точність аналізу, та може не повною мірою відобразити реальну картину поведінки користувачів. А це, своєю чергою, може призвести до прийняття неефективних маркетингових рішень.
Існують два види семплінгу:
- Коли відображаються змодельовані метрики: наприклад, транзакції, кількість користувачів тощо. Система бере вибірку та моделює ці метрики.
- Коли скорочується кількість за певним показником. Система, замість повного відображення даних, показує тільки дані найпопулярніших серед користувачів місця, відвідуваної сторінки, товару тощо, а інші дані «ховає» у рядку Other.
АНЦ зіштовхнулися з обома видами. Тому до Promodo звернулися з запитом створити автоматизований звіт, який дозволить відслідковувати повну картину даних.
Звісно, відстежувати показники ефективності за всіма препаратами можна і в ручному форматі, але враховуючи кількість товарів в асортименті — це доволі складно, потребує більших ресурсів і часу та не виключає помилок через людський фактор.
Вхідні дані
Разом з GA4 АНЦ продовжували слідкувати за даними з Universal Analytics. А оскільки з 1 липня 2024 року доступ до інтерфейсу, даних та API Universal Analytics втратиться, історичні дані за 2023 рік ми мали вивантажити та обʼєднати з даними GA4 в окремому звіті, щоб спростити подальший процес аналізу та планування.
Рішення
Для початку ми налаштували збір всієї інформації, що надходить з сайту та рекламних кабінетів АНЦ. Для цього використали Google BigQuery. Оскільки для GA4 вже існує вбудована інтеграція цього сервісу, це рішення дозволяє експортувати сирі дані з ресурсу напряму в хмарне сховище.
Google BigQuery — це хмарний сервіс для інтерактивного аналізу великих наборів даних, який дає можливість виконувати аналітичні запити різної складності, а також отримувати вичерпну аналітичну інформацію без необхідності керування інфраструктурою.
з Universal Analytics існує кілька способів:
Для АНЦ ми обрали варіант за допомогою API, оскільки цей спосіб дозволяє автоматизувати процес отримання даних, забезпечуючи швидкий і гнучкий доступ до великого обсягу інформації. Надалі це рішення дає можливість інтегрувати дані з іншими системами та застосунками для більш комплексного аналізу.
API (Application Programming Interface) — це набір інструментів, протоколів і визначень, які дозволяють різним програмним застосункам взаємодіяти між собою.
Весь процес експортування даних реалізувала команда Web-analytics Promodo за допомогою мови програмування Python.
Додатково налаштували експорт витрат з рекламних кабінетів Google Ads та Meta. Таким чином, ми зібрали для клієнта дані з різних джерел, з яких в подальшому можна будувати звіти різної складності через інструмент візуальної аналітики Power BI.
Об’єднання даних
Щоб об’єднати дані з рекламних кабінетів АНЦ та й надалі збирати дані про витрати з регулярним оновленням у звітах, ми використали відкриті API Google Ads та Meta. Це дозволило автоматизувати моніторинг витрат і оперативно отримувати актуальну інформацію для аналізу та оптимізації рекламних кампаній.
При об’єднанні даних Universal Analytics та GA4 ми враховували розбіжності у метриках цих аналітичних систем. Оскільки вони використовують різні способи збору даних.
Наприклад, в Google Analytics 4 є сигнали, які розпізнають користувачів, що заходили на сайт під одним обліковим записом з різних пристроїв. Таким чином GA4 відобразить у звіті умовного користувача [email protected], який заходив на сайт і з телефону, і з ПК, як 1 юзер. В той час як Universal Analytics порахував би його як двох: 1 окремий юзер з десктопа, і 1 — з мобайла.
Це лише декілька прикладів з десятків відмінностей між системами, через що дані у звітах суттєво відрізняються.
Побудова атрибуції
Для звіту АНЦ команда аналітиків Promodo використала атрибуцію за останнім кліком (або last non-push non-direct click).
Ця модель дозволяє аналізувати ефективність каналів, окремих оголошень або рекламних кампаній, які призвели до конверсії. У цьому випадку 100% цінності надається оголошенню, на яке натиснули останнім, та відповідному ключовому слову.
У той час, як кампанії з верхньої частини воронки — націлені на впізнаваність бренду або формування попиту — можуть не отримати жодної цінності.
Однак, попри те, що ця модель атрибуції зосереджена на максимізації кількості конверсій та для відстеження ефективності окремих оголошень або рекламних кампаній, важливо враховувати, що вона не дає уявлення про те, як інші маркетингові канали або кампанії могли вплинути на рішення користувача про конверсію.
Візуалізація
В рамках робіт з web-аналітики, для візуалізації даних ми зазвичай рекомендуємо клієнтам обирати серед трьох BI-систем.
Найбільше очікуванням та цілям клієнта відповідав Power BI, тому обрали її.
Висновки та перспективи
В результаті реалізованих робіт, АНЦ отримали готовий інструмент аналітики, який обʼєднує інформацію з двох Universal Analytics та GA4 без семплінгу та обмежень при формуванні звітів за потрібний період.
Всього в рамках робіт побудували 7 звітів, ось деякі з них:
Приклади налаштованих звітів
Налаштовані звіти в подальшому можна допрацьовувати та доповнювати даними з CRM, ERP, служб доставки та інших джерел відповідно до потреб клієнта.