Сегментация простыми словами
DATE_TRUNC('week', ts) в PostgreSQL (где ts типа timestamp)?Содержание:
Короткое объяснение
Сегментация — разделение пользователей / клиентов на группы по общим характеристикам.
Зачем: потому что «средний пользователь» не существует. Разные группы ведут себя по-разному и требуют разных подходов.
Типы сегментации
1. Демографическая
По характеристикам человека:
- Возраст, пол
- Образование
- Доход
- Профессия
Слабее работает в продуктовой аналитике, чем в маркетинге.
2. Географическая
- Страна, регион, город
- Климатическая зона
- Город vs село
Важно для продуктов с региональной спецификой.
3. Поведенческая (самая полезная для продукта)
По действиям в продукте:
- Частота использования
- Глубина вовлечённости
- Купленные категории
- Время использования
4. Психографическая
По ценностям и интересам:
- Инноваторы vs консерваторы
- Лояльные бренду vs чувствительные к цене
Сложно измерить напрямую.
5. По ценности (RFM / LTV)
- High-value (киты)
- Mid-value
- Low-value / new
Самая полезная для маркетинга и customer success.
RFM — классика сегментации
Recency — как давно была покупка Frequency — сколько покупок Monetary — общая сумма
Каждому пользователю ставят ранг по этим трём → 5×5×5 = 125 сегментов.
Упрощают до:
- Champions: высокие R, F, M
- Loyal: высокий F
- At risk: давно не покупали (низкий R, высокий F, M)
- Lost: давно не покупали, тратили мало
Подробнее: RFM анализ.
Методы сегментации
1. По правилам (rule-based)
Вручную задаём правила:
-- «VIP-клиент»
WHERE total_spent > 100000 AND last_purchase > NOW() - INTERVAL '30 days'Плюс: понятно бизнесу. Минус: ригидно, плохо адаптируется.
2. Кластеризация через ML
K-means, DBSCAN, иерархическая кластеризация — автоматически находят группы.
Плюс: находит паттерны, которые вы не предполагали. Минус: «чёрный ящик», сложно объяснить.
3. Гибридный подход
Сначала ML предлагает кластеры, потом аналитик их интерпретирует и переводит в rule-based правила.
Как выбрать переменные для сегментации
Хорошие переменные:
- Actionable: можем что-то сделать, зная сегмент
- Stable: не меняется день ото дня
- Meaningful: коррелирует с исходом (retention, выручка)
- Measurable: данные доступны
Пример: сегментация e-commerce
По правилам
- Новые: зарегистрировались < 30 дней назад
- Активные: ≥ 1 заказ за 90 дней
- В риске: последний заказ > 90 дней назад
- Потерянные: нет заказов > 180 дней
- VIP: топ-10% по LTV
Каждому сегменту — своя стратегия (welcome, upsell, reactivation, win-back, loyalty).
Применение
1. Таргетированный маркетинг
Разные сообщения разным сегментам → выше конверсия.
2. Персонализация
Рекомендации товаров по сегменту.
3. Customer success
Больше внимания сегменту с высокой ценностью.
4. Ценообразование
Разные тарифы для разных сегментов.
5. Продуктовые решения
Какой сегмент пострадает от изменения?
Сегментация в A/B
Если эффект разный в сегментах — агрегированный результат может обмануть.
Пример:
- Сегмент A: +5% к конверсии (значимо)
- Сегмент B: −3% к конверсии (значимо)
- В общем: +1% (не значимо)
Сегментация показывает реальный эффект.
Важно: сегментация после эксперимента — риск p-hacking. Фиксируйте сегменты заранее.
Частые ошибки
1. Слишком много сегментов
20 сегментов = никакой сегментации. Никто не помнит, что делать с сегментом №17.
2. Не actionable
Сегментация по цвету волос — невозможно использовать.
3. Переобучение
ML даёт «идеальные» кластеры на обучающих данных, которые не стабильны на новых.
4. Статичная сегментация
Пользователи переходят между сегментами. Нужна регулярная ре-сегментация.
5. Игнорировать малые сегменты
«Этот сегмент — всего 1%», но может приносить 30% выручки.
Пример: когда сегментация важна
«Общий retention 20%. Что улучшить?»
Без сегментации — неясно.
С сегментацией:
- Новые: retention 10% ← здесь проблема
- Старые: retention 40%
Проблема в онбординге → фокус на новых.
На собесе
«Что такое сегментация?» Разделение пользователей на группы по характеристикам.
«Какие виды?» Демографическая, географическая, поведенческая, RFM.
«Как выбрать переменные?» Actionable, stable, meaningful, measurable.
«Сегментация в A/B?» Может скрыть разнородный эффект. Но пост-фактум — риск p-hacking.
Связанные темы
- RFM анализ
- Когортный анализ простыми словами
- Что такое clustering простыми словами
- Customer journey map
FAQ
Сколько сегментов оптимально?
3–7 для действий. Больше — рассеивает внимание.
По правилам или через ML?
Начните с rule-based. ML — когда хотите найти неочевидные паттерны.
Сегментация vs когортный анализ?
Сегментация — по статической характеристике. Когорта — по времени контакта.
Как часто пересчитывать?
Ежемесячно или ежеквартально. Пользователи переходят между сегментами.