Атрибуция простыми словами

Проверь себя · 1/3разбор после ответа
Дано выражение: CASE WHEN status = 'paid' THEN amount ELSE 0 END. Что вернётся, если status = NULL и amount = 500?

Короткое объяснение

Атрибуция — это способ определить, какому маркетинговому каналу «засчитать» конверсию пользователя.

Например: пользователь увидел баннер в Яндексе, потом нашёл вас через Google, потом получил промо-письмо и купил. Кому засчитать покупку — Яндексу, Google, email? Это решает модель атрибуции.

Зачем нужна атрибуция

  • Чтобы решить, какому каналу сколько бюджета выделить
  • Чтобы понять, какой канал работает лучше
  • Чтобы посчитать ROAS по каналам
  • Чтобы сравнить эффективность кампаний

Типичный путь пользователя

Реальные пути не прямолинейны:

День 1: увидел баннер (Yandex Display)
День 3: кликнул рекламу в поиске (Yandex Search)
День 5: вернулся через закладку (прямой заход)
День 7: получил email-рассылку (Email)
День 7: купил

Кто «принёс» покупку? Вот тут и нужна модель.

Основные модели атрибуции

1. Last-click (последний клик)

Конверсию засчитывают последнему каналу перед покупкой.

В примере → Email получает 100% кредита.

Плюсы:

  • Просто считать
  • Используется по умолчанию в большинстве систем
  • Ясный ответ

Минусы:

  • Недооценивает роль каналов узнаваемости (awareness)
  • Переоценивает ретаргетинг и email
  • Убивает бренд-активность (её заслуги не видны)

2. First-click (первый клик)

Конверсия засчитывается первому каналу.

В примере → Yandex Display получает 100%.

Плюсы:

  • Ценит каналы узнаваемости
  • Ясный ответ

Минусы:

  • Игнорирует последующие точки
  • Часто переоценивает первую точку (могут быть случайные)

3. Linear attribution

Конверсия делится поровну между всеми касаниями.

В примере 4 канала → каждому по 25%.

Плюсы:

  • Справедливо распределяет
  • Видна вся воронка

Минусы:

  • Не учитывает разную важность касаний
  • Усредняет — не показывает, что реально работает

4. Time-decay

Ближе к конверсии — больше вес. Дальше — меньше.

В примере:

  • Email (день 7): 50%
  • Прямой заход (день 5): 30%
  • Search (день 3): 15%
  • Display (день 1): 5%

Плюсы:

  • Учитывает «свежесть» касания
  • Лучше first-click и linear

Минусы:

  • Параметры затухания задаются руками
  • Всё равно упрощает

5. Position-based (U-shaped)

40% первому касанию, 40% последнему, 20% между.

Плюсы:

  • Ценит и узнаваемость, и закрытие сделки
  • Учитывает «начало и конец»

Минусы:

  • Магические числа (почему 40-20-40?)

6. Data-driven attribution

Алгоритм (обычно ML) считает реальный вклад каждого канала на основе данных.

Плюсы:

  • Самая точная (в теории)
  • Адаптируется к реальным паттернам

Минусы:

  • Требует много данных
  • Сложно интерпретировать (чёрный ящик)
  • Нужны правильные инструменты (Google Analytics 360, собственный ML)

Сравнение моделей

Один и тот же пользователь, четыре касания:

Канал Last-click First-click Linear Time-decay
Display 0% 100% 25% 5%
Search 0% 0% 25% 15%
Direct 0% 0% 25% 30%
Email 100% 0% 25% 50%

Выбор модели ОЧЕНЬ сильно влияет на выводы.

Post-view vs post-click атрибуция

  • Post-click — засчитываем, если пользователь кликнул
  • Post-view — засчитываем, если пользователь видел показ (impression) и потом конвертировался без клика

Post-view обычно используется для display и бренд-рекламы. Легче приписать ложный кредит.

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Окно атрибуции

Окно = сколько дней учитывать до конверсии.

  • 7 дней — стандартно для быстрых продуктов
  • 28 дней — сложные покупки, B2B
  • 90 дней — enterprise, долгий цикл

Apple ATT с 2021 года ограничил post-view до 24 часов на iOS. Это сильно сдвинуло многие модели.

Incremental attribution

Все вышеописанные модели говорят: «какому каналу засчитать». Но НЕ говорят: «сколько бы мы продали БЕЗ этого канала».

Incremental attribution (инкрементальная атрибуция) пытается ответить на второе. Методы:

  • Holdout-тесты: случайно выключаем канал для 10% аудитории
  • Гео-эксперименты: выключаем в одном регионе
  • MMM (marketing mix modeling): эконометрика на агрегированных данных

Incremental — «золотой стандарт», но сложнее и дороже.

На собесе

Типичный вопрос: «Как выбирать модель атрибуции?»

Хороший ответ:

  • Нет универсальной «правильной» модели
  • Last-click — дефолт, но занижает узнаваемость
  • Сравнить несколько моделей → увидеть, как меняется рейтинг каналов
  • Для стратегии — инкрементальная атрибуция (holdout / MMM)
  • Атрибуция ≠ причинность

Частые ошибки

Ошибка 1. Использовать только last-click

Запустили performance → last-click покажет отличные результаты. Но без display/узнаваемости новых пользователей не будет.

Ошибка 2. Верить, что атрибуция = причинность

Атрибуция говорит «какому каналу засчитать». Не говорит «эта покупка произошла ИЗ-ЗА этого канала».

Ошибка 3. Не учитывать разные устройства

Пользователь на мобильном увидел, на десктопе купил. Без сквозной идентификации атрибуция неточная.

Ошибка 4. Сравнивать ROAS с разными моделями

Если performance-отдел считает по last-click, а продакт — по linear, всё «оптимизируется» в разных направлениях.

Ошибка 5. Забыть про органику

Если прямой трафик или органика растут — их стоит учитывать как отдельный «канал», иначе вклад платных каналов завышен.

Связанные темы

FAQ

Какая модель самая правильная?

Нет единой правильной. Используйте несколько моделей параллельно.

iOS ATT убил атрибуцию?

Не убил, но усложнил. Post-view 24 часа на iOS, многие пользователи невидимы.

Что такое инкрементальность?

Доля продаж, которую вы получили БЛАГОДАРЯ каналу (а не которая и так бы случилась).

Как измерить инкрементальность?

Holdout-тесты (выключить канал для части аудитории) или MMM.