Как посчитать медиану? - коротко
Отсортируйте набор чисел; если их количество нечётно, медиана — это средний элемент, а при чётном количестве — среднее арифметическое двух центральных значений.
Как посчитать медиану? - развернуто
Медиана – это значение, которое делит упорядоченный набор чисел пополам: половина элементов оказывается не меньше её, а другая половина – не больше. Чтобы получить этот показатель, необходимо выполнить несколько последовательных действий.
Во‑первых, соберите все числа, для которых требуется найти медиану. Если набор уже отсортирован, переходите к следующему шагу; если нет – упорядочьте его по возрастанию. Упорядочивание может быть выполнено любым известным алгоритмом сортировки (например, быстрой сортировкой, сортировкой слиянием или простым пузырьковым методом), но главное – получить строго возрастающий или невозрастающий ряд.
Во‑вторых, определите количество элементов в получившемся порядке. Обозначим его через (n).
- Если (n) нечётное, медиана совпадает с элементом, стоящим в середине ряда. Его позиция вычисляется как (\frac{n+1}{2})‑й элемент (при нумерации с единицы). Например, в наборе из 7 чисел медиана будет 4‑мым элементом после сортировки.
- Если (n) чётное, медиана определяется как среднее арифметическое двух центральных элементов. Их позиции – ( \frac{n}{2})‑й и ( \frac{n}{2}+1)‑й элементы. Суммируйте эти два значения и разделите результат на два. Например, в наборе из 8 чисел медиана будет (\frac{a_4 + a_5}{2}), где (a_i) – отсортированные элементы.
Для практического применения удобно оформить процесс в виде простого алгоритма:
- Получить массив данных.
- Отсортировать массив по возрастанию.
- Вычислить количество элементов (n).
- Если (n) нечётное, вернуть элемент с индексом ((n-1)/2) (при нулевой индексации).
- Если (n) чётное, вернуть (\frac{arr[n/2 - 1] + arr[n/2]}{2}).
Особенности, которые стоит учитывать:
- При работе с большими наборами данных иногда выгоднее использовать алгоритмы, находящие медиану без полной сортировки (например, метод «quickselect»), что позволяет сократить временную сложность до (O(n)) в среднем.
- Если данные содержат повторяющиеся значения, медиана всё равно будет корректно определена, поскольку сортировка сохраняет их порядок.
- При работе с данными, представленными в виде дробей или чисел с плавающей точкой, следует обратить внимание на точность вычислений, особенно в случае чётного количества элементов, где требуется деление суммы двух чисел.
Таким образом, вычисление медианы сводится к упорядочиванию набора и простому выбору центрального элемента или среднего двух центральных элементов, в зависимости от чётности количества наблюдений. Этот показатель часто используется для оценки типичного значения в распределениях, где среднее может быть искажено экстремальными выбросами.