Медиана и среднее арифметическое – в чем разница?

Медиана и среднее арифметическое – в чем разница? - коротко

Среднее арифметическое рассчитывается как сумма всех наблюдений, делённая на их число, и сильно чувствительно к экстремальным значениям. Медиана — это центральный элемент упорядоченного набора, который остаётся неизменным при наличии выбросов.

Медиана и среднее арифметическое – в чем разница? - развернуто

Медиана — это значение, которое делит упорядоченный набор данных на две равные части. Если количество наблюдений нечётное, медиана совпадает с центральным элементом; при чётном числе наблюдений берут среднее арифметическое двух центральных значений. Среднее арифметическое — это сумма всех элементов, делённая на их количество. Оно учитывает каждый член выборки одинаково и отражает общую «массу» данных.

Первое существенное различие заключается в чувствительности к экстремальным значениям. Среднее арифметическое реагирует на любые отклонения: одно слишком большое или слишком маленькое число может заметно сместить его. Медиана же остаётся почти неизменной, потому что её положение определяется лишь порядком элементов, а не их величиной. Поэтому в распределениях с сильными выбросами предпочтительнее использовать медиану.

Второй момент – форма распределения. При симметричной (нормальной) выборке медиана и среднее часто почти совпадают, что свидетельствует о равномерном распределении отклонений по обе стороны от центра. При асимметричной (скошенной) распределении они расходятся: в правой (положительной) скосу медиана будет меньше среднего, а в левой — выше.

Практические задачи подсказывают, какой показатель более уместен:

  • Оценка типичного дохода населения: медиана лучше отражает «обычную» зарплату, так как несколько миллионеров не искажают результат.
  • Вычисление средней температуры за месяц: среднее арифметическое удобно, потому что каждое измерение имеет равный вклад в общий климатический показатель.
  • Анализ времени выполнения задач в проекте: если в выборке есть редкие, но очень длительные задержки, медиана покажет более реалистичную оценку типичного срока.

Список преимуществ и ограничений:

Среднее арифметическое

  • Преимущества: простота расчёта, применимость в теоретических моделях, возможность использовать свойства линейности.
  • Ограничения: высокая чувствительность к выбросам, неинформативно при сильно асимметричных данных.

Медиана

  • Преимущества: устойчивость к экстремальным значениям, более репрезентативна для распределений с длинными хвостами.
  • Ограничения: требует сортировки данных, в больших выборках может быть вычислительно дороже, не обладает свойством линейности (сумма медиан разных выборок не равна медиане их объединения).

Итоговый вывод прост: если цель — получить показатель, отражающий общий уровень всех наблюдений и допускающий влияние каждого из них, выбирают среднее арифметическое. Когда важнее узнать, какое значение находится в «середине» большинства наблюдений и при этом исключить влияние редких экстремумов, предпочтительнее медиана. Правильный выбор статистики зависит от характера данных и задачи анализа.