Короткий ответ, что это спорно. Вопреки совету, который вы упоминаете, люди во многих областях используют порядковые шкалы и часто счастливы, что делают то, что они хотят. Средний балл или эквивалент во многих образовательных системах являются одним из примеров.
Однако порядковые данные, которые обычно не распределяются, не являются веской причиной, поскольку среднее значение
широко используется для ненормальных распределений
математически четко определено для очень многих ненормальных распределений, за исключением некоторых патологических случаев.
Возможно, не стоит использовать среднее значение на практике, если данные точно не распределены нормально, но это не так.
Более сильная причина не использовать среднее с порядковыми данными состоит в том, что его значение зависит от соглашений по кодированию. Числовые коды, такие как 1, 2, 3, 4, обычно просто выбираются для простоты или удобства, но в принципе они также могут быть равны 1, 23, 456, 7890, насколько они соответствуют определенному порядку. В любом случае взятие среднего означало бы буквальное восприятие этих условных обозначений (а именно, как если бы цифры были не произвольными, а оправданными), и для этого нет строгих оснований. Вам нужна интервальная шкала, в которой равные различия между значениями могут быть приняты буквально, чтобы оправдать принятие средств. Это я считаю главным аргументом, но, как уже указывалось, люди часто игнорируют его и сознательно, потому что они находят средства полезными, что бы ни говорили теоретики измерения.
Вот дополнительный пример. Часто людей просят выбрать один из «категорически не согласен» ... «полностью согласен» и (в зависимости отчасти от того, что хочет программное обеспечение), исследователи кодируют это как 1 .. 5 или 0 .. 4 или как они хотят, или объявляют его в качестве упорядоченного фактора (или любого другого термина, используемого программным обеспечением). Здесь кодирование произвольно и скрыто от людей, которые отвечают на вопрос.
Но часто также люди спрашивают (скажем) по шкале от 1 до 5, как вы оцениваете что-то? Примеров предостаточно: сайты, спорт, другие виды соревнований и даже образование. Здесь людям показывают шкалу и просят ее использовать. Широко известно, что нецелые числа имеют смысл, но вам просто разрешают использовать целые числа как соглашение. Это порядковая шкала? Некоторые говорят да, некоторые говорят нет. Иначе говоря, часть проблемы заключается в том, что порядковый масштаб сам по себе является нечеткой или обсуждаемой областью.
Снова рассмотрите оценки за академическую работу, скажем, от E до A. Часто такие оценки также обрабатываются численно, например, от 1 до 5, и обычно люди вычисляют средние значения для учащихся, курсов, школ и т. Д. И проводят дальнейший анализ таких данных. Хотя остается верным, что любое сопоставление с числовыми оценками является произвольным, но приемлемым, если оно сохраняет порядок, тем не менее на практике люди, присваивающие и получающие оценки, знают, что оценки имеют числовые эквиваленты, и знают, что оценки будут усреднены .
Одной из прагматических причин использования средств является то, что медианы и способы часто являются плохим обобщением информации в данных. Предположим, у вас есть шкала от абсолютно не согласного до полностью согласного, и для удобства кодируйте эти пункты 1-5. Теперь представьте один пример, закодированный 1, 1, 2, 2, 2 и еще 1, 2, 2, 4, 5. Теперь поднимите ваши руки, если вы думаете, что медиана и мода являются единственными оправданными резюме, потому что это порядковая шкала. Теперь поднимите руки, если вы найдете среднее значение полезным, независимо от того, правильно ли определены суммы и т. Д.
Естественно, среднее значение будет представлять собой гиперчувствительную сводку, если бы коды представляли собой квадраты или кубы, скажем, от 1 до 5, а это может быть не то, что вы хотите. (Если ваша цель состоит в том, чтобы быстро идентифицировать старшие листы, это может быть именно тем, что вам нужно!) Но именно поэтому обычное кодирование с последовательными целочисленными кодами является практическим выбором, поскольку на практике оно часто работает довольно хорошо. Это не тот аргумент, который имеет какое-либо значение для теоретиков измерений, и не должен этого делать, но аналитики данных должны быть заинтересованы в составлении резюме, насыщенного информацией.
Я согласен со всеми, кто говорит: используйте все распределение частот оценок, но это не главное.