28 июня 2026 г.·11 мин чтения

Центральная предельная теорема (ЦПТ) простыми словами

Проверь себя · 1/3разбор после ответа

Нужно пронумеровать заказы каждого пользователя по времени покупки, начиная с 1, чтобы найти его 1-й, 2-й, 3-й заказ. Какое выражение подходит?

Содержание:

Зачем это знать
Что такое ЦПТ простыми словами
Демонстрация на кубике
Условия применимости
Стандартная ошибка среднего
Почему ЦПТ — фундамент статистики
ЦПТ против закона больших чисел
Частые ошибки
Связанные темы
FAQ

Зачем это знать

Центральная предельная теорема (ЦПТ) — это причина, по которой вообще работают почти все ваши A/B-тесты и доверительные интервалы. Данные в продукте редко бывают красивыми: чеки, выручка на пользователя, время на сайте — всё это скошенные, тяжелохвостые, иногда бимодальные распределения. Но статистика, которой мы пользуемся каждый день, спокойно с ними справляется, и держится она именно на ЦПТ.

Дело в том, что теорема говорит не про сами данные, а про их среднее. Какими бы кривыми ни были исходные значения, среднее достаточно большой выборки распределено почти нормально. Именно это превращает хаос реальных метрик в управляемую задачу: появляется нормальная кривая, по которой можно считать вероятности, строить интервалы и сравнивать группы.

На собеседованиях middle и senior аналитика вопрос «почему t-test работает на ненормальных данных?» — это прямая проверка, понимаете ли вы ЦПТ или просто заучили рецепт. Кандидат, который путает нормальность данных с нормальностью среднего, сразу выдаёт пробел в фундаменте. Поэтому разобраться стоит один раз и навсегда.

Что такое ЦПТ простыми словами

Если коротко: возьмите выборку из любого распределения, посчитайте её среднее, повторите это много раз — и распределение полученных средних будет приближаться к нормальному (колоколу) по мере роста размера выборки. Исходное распределение при этом может быть каким угодно: равномерным, экспоненциальным, скошенным вправо. Важно лишь, чтобы наблюдения были независимыми и имели конечную дисперсию.

Ключевое слово здесь — среднее. ЦПТ ничего не обещает про отдельные значения. Если ваши чеки скошены вправо, они такими и останутся, сколько данных ни собирай. Нормальным становится не сам признак, а статистика, которую вы из него считаете — среднее по выборке. Это различие — главный источник путаницы вокруг теоремы, и именно его проверяют на собесе.

Формально звучит так. Пусть есть независимые одинаково распределённые величины со средним мю и дисперсией сигма в квадрате. Тогда выборочное среднее по мере роста размера выборки ведёт себя как нормальная величина с тем же центром мю и с дисперсией, равной сигма в квадрате, делённой на размер выборки. То есть разброс средних сужается с ростом числа наблюдений, а форма распределения этих средних стягивается к колоколу — независимо от того, как выглядело исходное распределение.

Демонстрация на кубике

Самый наглядный пример — обычный игральный кубик. Один бросок даёт равномерное распределение: числа от 1 до 6 выпадают одинаково часто, никакого колокола тут нет, гистограмма плоская. Если на этом остановиться, нормальностью и не пахнет.

Теперь меняем эксперимент. Бросаем кубик не один раз, а, скажем, тридцать, и записываем среднее этих тридцати бросков. Потом повторяем такой опыт тысячу раз и строим гистограмму уже из этих тысячи средних. Картина меняется драматично: плоское равномерное распределение исходных бросков превращается в аккуратный колокол вокруг значения 3.5. Равномерное на входе, нормальное на выходе — и всё благодаря усреднению.

Это и есть суть ЦПТ в одном опыте. Усреднение «съедает» форму исходного распределения, потому что крайние значения встречаются редко и взаимно гасятся: чтобы среднее тридцати бросков оказалось близко к единице, нужно почти тридцать единиц подряд, а это практически невероятно. Поэтому средние кучкуются у центра и редеют по краям — ровно как колокол. Проверить это руками можно за несколько строк на Python:

import numpy as np

# Исходное распределение — равномерное, никакого колокола
data = np.random.uniform(0, 10, 100_000)

# Берём по 30 значений, считаем среднее, повторяем 10 000 раз
means = [np.mean(np.random.choice(data, 30)) for _ in range(10_000)]

# Гистограмма means окажется колоколом, хотя data — равномерное

Условия применимости

ЦПТ — не магия без ограничений, у неё есть условия. Первое — независимость наблюдений: значения не должны влиять друг на друга. Если данные сильно зависимы (например, измерения одного пользователя во времени или соседние точки временного ряда), классическая теорема может требовать поправок, и наивный t-test даст заниженные доверительные интервалы. На практике это значит, что единицей наблюдения в A/B-тесте обычно должен быть пользователь, а не отдельное событие.

Второе условие — конечная дисперсия. Распределение обязано иметь не только определённое среднее, но и конечный разброс. Большинство реальных метрик этому удовлетворяют, но есть экзотические исключения вроде распределения Коши, у которого ни среднего, ни дисперсии нет. Среднее выборки из Коши не сходится к нормальному и вообще не стабилизируется — это любимый контрпример экзаменаторов. Классическая формулировка добавляет и третье требование — одинаковую распределённость (наблюдения из одного распределения, то самое IID), хотя обобщённые версии теоремы умеют работать и с разными слагаемыми.

Отдельный вопрос — что считать «достаточно большой» выборкой. Популярный ориентир — размер от 30, и для умеренно несимметричных данных его обычно хватает. Но это правило большого пальца, а не закон: для почти симметричных распределений нормальность проступает уже при 10 наблюдениях, а для сильно скошенных, тяжелохвостых метрик (доход, выручка на клиента) и сотни может оказаться мало. Универсальный порог не существует; если сомневаетесь, смотрите на Q-Q plot выборочных средних или используйте bootstrap, который не опирается на порог n вообще.

Стандартная ошибка среднего

У нормального распределения выборочных средних есть конкретный разброс, и у него своё имя — стандартная ошибка среднего. Считается она просто: стандартное отклонение исходных данных (сигма) делим на корень из размера выборки. То есть чем больше наблюдений, тем меньше стандартная ошибка и тем плотнее средние жмутся к истинному значению.

Главное в этой формуле — корень. Разброс среднего падает не пропорционально размеру выборки, а пропорционально корню из него. Чтобы сократить стандартную ошибку вдвое, нужно не вдвое, а вчетверо больше данных. Это закон убывающей отдачи в чистом виде, и именно он объясняет, почему A/B-тесты на маленький эффект требуют непропорционально огромных выборок: точность дорожает квадратично.

Стандартную ошибку легко спутать со стандартным отклонением, но это разные вещи. Стандартное отклонение описывает разброс самих данных и с ростом выборки никуда не девается — оно стремится к настоящему сигме популяции. Стандартная ошибка описывает разброс оценки среднего и с ростом выборки стремится к нулю. Первое — про то, насколько разнятся объекты; второе — про то, насколько точно мы знаем их средний уровень.

Подготовься к собесу по A/B и статистике

300+ вопросов с разбором: дизайн, размер выборки, p-value, ловушки

Тренировать A/B в Telegram

Почему ЦПТ — фундамент статистики

ЦПТ — это мост между «у меня есть выборка» и «я могу сделать вывод о всей популяции». Без неё мы бы не знали, как ведёт себя выборочное среднее, и не могли бы посчитать ни одной вероятности вокруг него. А раз мы знаем, что среднее распределено почти нормально со стандартной ошибкой сигма на корень из n, мы можем строить доверительные интервалы и проверять гипотезы.

Доверительный интервал для среднего получается прямо из этого знания: берём выборочное среднее и отступаем в обе стороны примерно на две стандартные ошибки (точнее, на 1.96 для 95% уверенности). Полученный диапазон с заданной частотой накрывает истинное среднее популяции. Эта простая конструкция возможна только потому, что ЦПТ гарантирует нормальную форму распределения среднего.

На том же фундаменте стоит проверка гипотез и A/B-тесты. Z-test и t-test сравнивают средние групп, предполагая, что эти средние нормальны — а нормальны они благодаря ЦПТ, даже если сами метрики далеки от колокола. Конверсия принимает только нули и единицы, выручка скошена вправо, но их средние по группам ведут себя прилично, и тест корректно считает p-value. Когда выборки малы или статистика сложная (медиана, перцентиль, отношение метрик), на помощь приходит bootstrap — он добивается того же результата перевыборками, не опираясь на аналитическую формулу ЦПТ. Если хочется закрепить связку ЦПТ, доверительных интервалов и проверки гипотез на реальных задачах, удобно прорешать их блоками в тренажёре по статистике на kariernik.ru — там вопросы про распределения, стандартную ошибку и A/B идут с пояснениями.

ЦПТ против закона больших чисел

ЦПТ постоянно путают с законом больших чисел (ЗБЧ), хотя это две разные теоремы про разное. Закон больших чисел говорит о том, куда сходится среднее: с ростом выборки выборочное среднее приближается к истинному математическому ожиданию. Это утверждение про точку — про то, что оценка не врёт в среднем и стабилизируется около правильного значения.

Центральная предельная теорема говорит о другом — о форме и масштабе колебаний вокруг этой точки. ЗБЧ обещает, что среднее придёт куда надо; ЦПТ описывает, как именно оно туда идёт — с нормально распределённым отклонением, ширина которого равна стандартной ошибке. Можно сказать так: ЗБЧ объясняет, почему оценка состоятельна, а ЦПТ — почему вокруг неё можно построить доверительный интервал. Первая даёт центр, вторая — разброс и форму. Вместе они и составляют логическую основу всей выборочной статистики.

Частые ошибки

Самая распространённая ошибка — думать, что ЦПТ делает нормальными сами данные. Это неверно. Теорема касается распределения выборочного среднего, а не отдельных значений. Если признак скошен, он останется скошенным при любом объёме данных; нормальным становится только его среднее по выборке. На собесе эта подмена — почти гарантированный минус.

Вторая ловушка — игнорировать независимость. Когда наблюдения зависимы (повторные замеры одного пользователя, соседние точки временного ряда, кластеризованные данные), наивное применение ЦПТ занижает стандартную ошибку и раздувает значимость. В A/B-тестах это лечат правильным выбором единицы рандомизации и поправками на кластеры.

Третья — слепо верить в порог n ≥ 30. Для экспоненциального распределения при выборке из пяти значений средние ещё совсем не нормальны, и тридцати может не хватить для тяжёлых хвостов вроде дохода или LTV. Порог 30 — ориентир для умеренной асимметрии, а не универсальная гарантия; для сильно скошенных метрик проверяйте нормальность средних через Q-Q plot или переходите на bootstrap. И, наконец, не забывайте про условие конечной дисперсии: на распределениях вроде Коши ЦПТ просто не работает, и формальные тесты на средних там бессмысленны.

Связанные темы

FAQ

Правда ли, что выборка всегда должна быть не меньше 30?

Нет, 30 — это лишь популярный ориентир для умеренно скошенных данных. Для почти симметричных распределений достаточно и 10 наблюдений, а для сильно скошенных, тяжелохвостых метрик может не хватить и сотни. Универсального порога нет: ориентируйтесь на форму исходного распределения и проверяйте нормальность средних через Q-Q plot или bootstrap.

ЦПТ работает только для среднего или для других статистик тоже?

Классическая теорема сформулирована для суммы и среднего. Многие другие статистики (например, медиана) при больших выборках тоже приближаются к нормальному распределению, но с другой дисперсией и при своих условиях. Для сложных статистик и отношений метрик удобнее не выводить формулу, а оценивать распределение через bootstrap.

Чем ЦПТ отличается от закона больших чисел?

Закон больших чисел говорит, что выборочное среднее сходится к истинному математическому ожиданию — это про положение точки. ЦПТ говорит, как среднее колеблется вокруг этой точки — почти нормально, со стандартной ошибкой сигма на корень из n. Первый даёт центр, вторая — форму и масштаб разброса.

Почему среднее становится именно нормальным, а не каким-то другим?

Это следствие математики свёртки: когда вы складываете много независимых случайных эффектов, их совместное распределение неизбежно стягивается к нормальному, какими бы ни были слагаемые. Нормальное распределение здесь — это «аттрактор» сумм, к которому всё сходится при росте числа слагаемых с конечной дисперсией.

Можно ли применять t-test к ненормальным данным?

Да, и именно ЦПТ это оправдывает. t-test сравнивает средние групп, а средние при достаточном размере выборки распределены почти нормально, даже если сами данные — конверсия, выручка, время — далеки от колокола. На малых или сильно скошенных выборках надёжнее перепроверить вывод через bootstrap или непараметрический тест.

Когда ЦПТ не работает вообще?

Когда нарушены её условия. Если у распределения бесконечная дисперсия (классический пример — распределение Коши), среднее выборки не сходится к нормальному и не стабилизируется. Аналогично ломается удобная теория при сильной зависимости наблюдений: тогда стандартная ошибка считается неправильно, и нужны поправки на корреляцию или кластеры.