Часто вводные тексты по прикладной статистике отличают среднее от медианного (часто в контексте описательной статистики и мотивации суммирования центральной тенденции с использованием среднего, медианного значения и режима), объясняя, что среднее значение чувствительно к выбросам в данных выборки и / или искаженное распределение населения, и это используется в качестве оправдания для утверждения, что медиана должна быть предпочтительной, когда данные не симметричны.
Например:
Наилучшая мера центральной тенденции для данного набора данных часто зависит от того, каким образом распределяются значения .... Когда данные не симметричны, медиана часто является лучшей мерой центральной тенденции. Поскольку среднее значение чувствительно к экстремальным наблюдениям, оно вытягивается в направлении значений внешних данных, и в результате оно может оказаться чрезмерно раздутым или чрезмерно
сдутым . "- Pagano and Gauvreau, (2000) Принципы биостатистики , 2-е изд. (P & G были под рукой, кстати, не выделяя их как таковые .)
Авторы определяют «центральную тенденцию» следующим образом: «Наиболее часто исследуемой характеристикой набора данных является его центр или точка, в которой наблюдения имеют тенденцию группироваться».
Это кажется мне менее чем прямым способом сказать, что используется только медиана, период , потому что только использование среднего значения, когда данные / распределения симметричны, - это то же самое, что сказать, использовать только среднее значение, когда оно равно медиане. Изменить: что справедливо указывает на то, что я объединяю надежные меры центральной тенденции с медианой. Поэтому важно иметь в виду, что я обсуждаю конкретное обрамление среднего арифметического и медианы во вводной прикладной статистике (где, если не считать, другие показатели центральной тенденции не мотивированы).
Вместо того, чтобы судить о полезности среднего по тому, насколько оно отличается от поведения медианы, не должны ли мы просто понимать это как две разные меры центральности? Другими словами, чувствительность к асимметрии является характерной чертой. С таким же успехом можно утверждать, что «медиана не годится, потому что она в значительной степени нечувствительна к асимметрии, поэтому используйте ее только тогда, когда она равна среднему».
(Режим довольно разумно не связывается с этим вопросом.)