Сегментация простыми словами

Проверь себя · 1/3разбор после ответа
Какое утверждение верно про DATE_TRUNC('week', ts) в PostgreSQL (где ts типа timestamp)?

Короткое объяснение

Сегментация — разделение пользователей / клиентов на группы по общим характеристикам.

Зачем: потому что «средний пользователь» не существует. Разные группы ведут себя по-разному и требуют разных подходов.

Типы сегментации

1. Демографическая

По характеристикам человека:

  • Возраст, пол
  • Образование
  • Доход
  • Профессия

Слабее работает в продуктовой аналитике, чем в маркетинге.

2. Географическая

  • Страна, регион, город
  • Климатическая зона
  • Город vs село

Важно для продуктов с региональной спецификой.

3. Поведенческая (самая полезная для продукта)

По действиям в продукте:

  • Частота использования
  • Глубина вовлечённости
  • Купленные категории
  • Время использования

4. Психографическая

По ценностям и интересам:

  • Инноваторы vs консерваторы
  • Лояльные бренду vs чувствительные к цене

Сложно измерить напрямую.

5. По ценности (RFM / LTV)

  • High-value (киты)
  • Mid-value
  • Low-value / new

Самая полезная для маркетинга и customer success.

RFM — классика сегментации

Recency — как давно была покупка Frequency — сколько покупок Monetary — общая сумма

Каждому пользователю ставят ранг по этим трём → 5×5×5 = 125 сегментов.

Упрощают до:

  • Champions: высокие R, F, M
  • Loyal: высокий F
  • At risk: давно не покупали (низкий R, высокий F, M)
  • Lost: давно не покупали, тратили мало

Подробнее: RFM анализ.

Методы сегментации

1. По правилам (rule-based)

Вручную задаём правила:

-- «VIP-клиент»
WHERE total_spent > 100000 AND last_purchase > NOW() - INTERVAL '30 days'

Плюс: понятно бизнесу. Минус: ригидно, плохо адаптируется.

2. Кластеризация через ML

K-means, DBSCAN, иерархическая кластеризация — автоматически находят группы.

Плюс: находит паттерны, которые вы не предполагали. Минус: «чёрный ящик», сложно объяснить.

3. Гибридный подход

Сначала ML предлагает кластеры, потом аналитик их интерпретирует и переводит в rule-based правила.

Как выбрать переменные для сегментации

Хорошие переменные:

  • Actionable: можем что-то сделать, зная сегмент
  • Stable: не меняется день ото дня
  • Meaningful: коррелирует с исходом (retention, выручка)
  • Measurable: данные доступны

Пример: сегментация e-commerce

По правилам

  • Новые: зарегистрировались < 30 дней назад
  • Активные: ≥ 1 заказ за 90 дней
  • В риске: последний заказ > 90 дней назад
  • Потерянные: нет заказов > 180 дней
  • VIP: топ-10% по LTV

Каждому сегменту — своя стратегия (welcome, upsell, reactivation, win-back, loyalty).

Готовься к собесу аналитика как в Duolingo
10 минут в день — SQL, Python, A/B, метрики. 1700+ вопросов в Telegram
Открыть Карьерник в Telegram

Применение

1. Таргетированный маркетинг

Разные сообщения разным сегментам → выше конверсия.

2. Персонализация

Рекомендации товаров по сегменту.

3. Customer success

Больше внимания сегменту с высокой ценностью.

4. Ценообразование

Разные тарифы для разных сегментов.

5. Продуктовые решения

Какой сегмент пострадает от изменения?

Сегментация в A/B

Если эффект разный в сегментах — агрегированный результат может обмануть.

Пример:

  • Сегмент A: +5% к конверсии (значимо)
  • Сегмент B: −3% к конверсии (значимо)
  • В общем: +1% (не значимо)

Сегментация показывает реальный эффект.

Важно: сегментация после эксперимента — риск p-hacking. Фиксируйте сегменты заранее.

Частые ошибки

1. Слишком много сегментов

20 сегментов = никакой сегментации. Никто не помнит, что делать с сегментом №17.

2. Не actionable

Сегментация по цвету волос — невозможно использовать.

3. Переобучение

ML даёт «идеальные» кластеры на обучающих данных, которые не стабильны на новых.

4. Статичная сегментация

Пользователи переходят между сегментами. Нужна регулярная ре-сегментация.

5. Игнорировать малые сегменты

«Этот сегмент — всего 1%», но может приносить 30% выручки.

Пример: когда сегментация важна

«Общий retention 20%. Что улучшить?»

Без сегментации — неясно.

С сегментацией:

  • Новые: retention 10% ← здесь проблема
  • Старые: retention 40%

Проблема в онбординге → фокус на новых.

На собесе

«Что такое сегментация?» Разделение пользователей на группы по характеристикам.

«Какие виды?» Демографическая, географическая, поведенческая, RFM.

«Как выбрать переменные?» Actionable, stable, meaningful, measurable.

«Сегментация в A/B?» Может скрыть разнородный эффект. Но пост-фактум — риск p-hacking.

Связанные темы

FAQ

Сколько сегментов оптимально?

3–7 для действий. Больше — рассеивает внимание.

По правилам или через ML?

Начните с rule-based. ML — когда хотите найти неочевидные паттерны.

Сегментация vs когортный анализ?

Сегментация — по статической характеристике. Когорта — по времени контакта.

Как часто пересчитывать?

Ежемесячно или ежеквартально. Пользователи переходят между сегментами.