Медиана, как мера центрильной тенденции выборки

Любой показатель в лабораторной диагностике имеет определенные границы нормы. Откуда их берут? Из обследования группы практически здоровых людей. В большинстве случаев распределение изучаемого показателя подчиняется нормальному закону. Тогда его можно полностью охарактеризовать средним арифметическим и дисперсией. Примеры из лабораторной практики: общий белок, альбумин, калий, натрий, эритроциты и др. А некоторые лабораторные показатели (опухолевые маркеры,> иммуноглобулин Е, альфа-фетопротеин у беременных, концентрация сперматозоидов в эякуляте) и у здоровых людей имеют некоторую асимметрию в распределении. Что уж говорить о патологии! Если ряд лабораторных показателей довольно стабильны и изменяются в узких пределах, то уровень других веществ может изменяться в десятки, сотни, тысячи раз. Это происходит по различным механизмам: за счет синтеза опухолевого маркера раковыми клетками, выхода фермента из разрушенных клеток печени или другого органа, синтеза иммуноглобулина Е при2 аллергической реакции, или иммуноглобулина G при инфекционном заболевании. Распределение признака приобретает в таком случае резко асимметричную форму. Отдельные крайние значения вносят значительные искажения в среднее арифметическое, а рассчитанное среднее квадратическое отклонение может оказаться больше среднего арифметического, что с точки зрения биологии – абсурд (хотя в статьях и книгах нам изредка встречалось). Поэтому в таких случаях указывают медиану – значение показателя выше и ниже, которого встречается равное число наблюдений.

Рассмотрим, в качестве примера, гистограмму распределения концентрации сперматозоидов в эякулятах у мужчин Самары. Картина напоминает распределение доходов в обществе. Из гистограммы видно, что процентов у 5-6 мужчин сперматозоидов более 200 млн/мл, а у 38% мужчин – менее 44 млн/мл. Для зачатия, кстати, достаточно 20 млн/мл. В данной выборке медиана равна 50 млн/мл. Это значит у половины обследованных мужчин сперматозоидов меньше 50 млн/мл, а у другой половины – больше. Среднее арифметическое и среднее квадратическое отклонение, соответственно: 73,0 и 77,9 млн/мл. Сплошная линия на графике показывает ожидаемое нормальное распределение. Как можно легко заметить, оно заметно отличается от реально наблюдаемого распределения, выраженного столбиками гистограммы. Более того, кривая ожидаемого нормального распределения уходит частично в область отрицательных чисел, что лишено биологического смысла. Чем больше отличается среднее арифметическое от медианы, тем более асимметрична выборка, и тем менее корректно использовать среднее арифметическое и среднее квадратическое отклонение для характеристики выборки.

Добавить комментарий