По определению порядковый масштаб - это датчик, в котором истинные расстояния между выемками 1 2 3 4
неизвестны. Это как будто вы видите правителя под наркотиками / алкоголем. Истинные расстояния могут быть любыми. Это может быть 1 2 3 4
или 1 2 3 4
или как угодно. Мы не можем вычислить статистику - такую как корреляция - если не определимся с расстояниями, исправим их.
Одно из рассуждений может быть следующим. Поскольку наша шкала измерения, датчик, искажается неизвестным монотонным способом, мы не можем поверить в значения данных. Только порядок их величин заслуживает доверия. Без дальнейшего использования мозгов, объявить порядок как ценность. Таким образом, мы заменяем наблюдаемое распределение на равномерное распределение рангов . После этого может вычисляться коэффициент ассоциации, скажем, Pearson . Это будет Spearman , как мы знаем. Пирсон измеряет силу линейной ассоциации. Ранжирование переменных было уловкой для линеаризации той части монотонных отношений, которая объясняется тем, что распределения изначально не были однородными. Таким образом, Спирманг ч о т т ч о трг ч орг ч оявляется мерой такой монотонности в отношениях, которая может быть преобразована в линейность под действием унификации маргинальных распределений. В вопросе OP только одна из двух переменных является порядковой (а вторая - непрерывной). Таким образом, обычно нет необходимости ранжировать обе переменные. Может просто ранжировать порядковый, а затем вычислить .р
Другим подходом , альтернативным ранжированию (униформированию), может быть оптимальное масштабирование порядковой переменной. Оптимальное масштабирование - это итеративная процедура, целью которой является поиск таких расстояний в порядковом масштабе, т. Е. Найти такое монотонное преобразование, чтобы линейный между переменными был максимально увеличен. Хотя подход ранжирования основан на предпосылке «истинный масштаб соответствует данным, имеющим равномерное распределение», подход оптимального масштабирования основан на предпосылке «истинный масштаб соответствует данным, имеющим максимальный линейныйррр«. Оптимальное масштабирование может быть выполнено в категориальной регрессии (CATREG). Однако для категориальной регрессии требуется, чтобы другая входная переменная была дискретной (не обязательно порядковой), и поэтому, если она непрерывна и имеет много уникальных значений, она должна быть произвольно сгенерирована вами ,
Есть и другие подходы. Но, в любом случае, мы преобразуем порядковый масштаб монотонно «чтобы…» (некоторое предположение или некоторая цель), потому что порядковый масштаб искажен нам неизвестным образом. В корне другое решение было бы сначала «протрезвить» и решить, что оно либо не искажено (то есть является интервалом), либо искажено известным способом (неэквивалентно), либо является номинальным.
Некоторые асимметричные подходы могут включать в себя порядковую регрессию порядковой переменной другой (интервальной / непрерывной). Или линейная регрессия этой последней по порядковой, с моделью, где предиктор принимается как полиномиальный контраст (то есть вводится как b1X + b2X^2 + b3X^3,...
). Слабость этих подходов заключается в том, что они асимметричны: одна переменная является зависимой, а другая - независимой.