Почему Пирсон параметрический, а Спирмен непараметрический


19

По-видимому, коэффициент корреляции Пирсона параметрический, а число Спирмена непараметрическое.

У меня проблемы с пониманием этого. Насколько я понимаю, Пирсон вычисляется как и вычисляется таким же образом, за исключением того, что мы подставляем все значения в их ранги.

рИксYзнак равносоv(Икс,Y)σИксσY

Википедия говорит

Разница между параметрической моделью и непараметрической моделью заключается в том, что первая имеет фиксированное количество параметров, а вторая увеличивает количество параметров с количеством обучающих данных.

Но я не вижу никаких параметров, кроме самих образцов. Некоторые говорят, что параметрические тесты предполагают нормальное распределение и продолжают утверждать, что Пирсон принимает нормальные распределенные данные, но я не понимаю, почему Пирсон этого потребовал.

Итак, мой вопрос: что означают параметрические и непараметрические значения в контексте статистики? И как там Пирсон и Спирман?


6
Это хороший вопрос, и там очень много дезинформации. Например, уравнение параметрических тестов и предположения о нормальном распределении, к сожалению, является частой путаницей, в результате чего многие авторы учебников, преподаватели курсов и интернет-постеры просто копируют информацию от других, которые находятся в замешательстве или более.
Ник Кокс

5
Возможно, самое простое положительное решение вопроса заключается в следующем: да, корреляция Спирмена - это параметр, который оценивается количественно, определяющий силу отношений, и поэтому он напоминает Пирсона (в корне это та же идея, как вы указали); но нет, корреляция Спирмена не является параметром, который фигурирует в распределении, тогда как корреляция Пирсона - это параметр в двумерном нормальном распределении (историческая, но теперь недооцененная интерпретация того, что вы делаете, когда вы делаете корреляцию). Это тонкое различие, которое нужно понять, увидев, что слово «параметр» имеет несколько значений.
Ник Кокс

@NickCox, почему бы тебе не опубликовать это как ответ?
Ричард Харди

5
Точка о нормальности распределения действительно укушается только тогда, когда вы хотите провести значимые тесты с корреляцией. Если вы используете корреляции только в качестве описательных мер, ненормальность не должна быть препятствием для использования корреляций. Корреляции могут даже быть немного полезными с двумя двоичными переменными, пока обе изменяются. Вам все еще нужно следить за эффектами выбросов и т. Д. И т. Д.
Ник Кокс

1
Поскольку это еще не было четко сказано, я хотел бы подчеркнуть, что никакая статистика не является «параметрической». Это как сказать, что числа вкусные: прилагательное просто не относится к существительному. Статистические модели могут быть параметрическими (как указано в цитате Википедии), а также тестами и процедурами, основанными на них. Статистика Спирмена и Пирсона может использоваться как в параметрических, так и в непараметрических настройках. Подробнее об этом на stats.stackexchange.com/questions/67204 . Что делает модель параметрической, так это ее пространство состояний .
whuber

Ответы:


17

Проблема в том, что в наши дни «непараметрический» действительно имеет два разных значения. Определение в Википедии относится к таким вещам, как аппроксимация кривой, например, с помощью сплайнов или локальной регрессии. Другое значение, которое является более старым, больше соответствует принципу «без распространения», то есть методам, которые могут применяться независимо от предполагаемого распределения данных. Последний является тем, который применяется к ро Спирмена, поскольку преобразование ранга подразумевает, что оно даст тот же результат, независимо от того, каким было ваше первоначальное распределение.


2
Непараметрический имеет два значения, но комментарий в Википедии действительно относится к обоим. В непараметрической регрессии это относится к отношениям, не являющимся конечно-параметрическим. С точки зрения «без распределения» это означает, что модели распределения не являются конечно-параметрическими.
Glen_b

1
Хм, это цитата из Википедии, это не я. Кто-то еще добавил это.
Хонг Ой

2
Основное редактирование, которое, по моему мнению, неверно в одной детали и не добавляет ничего особенно полезного, было передано на рассмотрение, поскольку оно было сделано пользователем с низким значением репутации и отклонено одним человеком, но затем было принято автоматически, когда третий человек попытался отредактировать, чтобы улучшить его (они, возможно, не поняли, что это будет следствием). Я собираюсь свернуть это редактирование обратно к вашему оригиналу. Вы можете сделать это в любое время, когда есть редактирование, которое вам не нравится.
Glen_b

Теперь вернемся к исходному сообщению, поскольку я думаю, что оно слишком сильно изменило ваш пост, не требуя вашего согласия, и не похоже, что вы с ним согласны. Если вам что-то понравилось, нажмите ссылку «отредактировано ... назад» над моим именем и скопируйте те части, которые вам понравились, из того, что было раньше, затем отредактируйте и вставьте их.
Glen_b -Восстановить Монику

Когда оправдано использование Spearman? Как Пирсон может помочь, когда вы используете Spearman?
Лео Леопольд Герц 준영

3

Я думаю, что единственная причина, по которой коэффициент корреляции Пирсона будет называться параметрическим, заключается в том, что вы можете использовать его для оценки параметров многомерного нормального распределения. например, двумерное нормальное распределение имеет 5 параметров: два средних, две дисперсии и коэффициент корреляции. Последнее можно оценить с помощью коэффициента корреляции Пирсона.

ρ


не является ли коэффициент коэффициента корреляции Пирсона в том смысле, что вы должны принять нормальность, чтобы проверить ее значимость? то есть, он не принимает нормальность как статистику, но вы предполагаете, что данные нормальны при вычислении распределения выборочного коэффициента корреляции и тестировании? это честный вопрос, я могу ошибаться на 100%.
Mugen

Можете ли вы объяснить, если вы делаете какие-либо предположения о распределении в Сперман и Кендалл?
Лео Леопольд Герц 준영

@ mugen, вам не нужно принимать нормальность, чтобы проверить значимость корреляции Пирсона; общий тест корреляции Пирсона делает так. Вы можете сделать другое параметрическое предположение и придумать другой тест ... или действительно, можно выполнить тест перестановки нулевого значения, что корреляция Пирсона для популяции равна нулю, что приводит к непараметрическому тесту.
Glen_b

0

Простейший ответ, который я считаю, заключается в том, что в тесте Спирмена на роу используются порядковые данные (числа, которые можно ранжировать, но не сообщают вам ничего о интервале между числами, например, 3 вида мороженого ранжируются 1, 2 и 3, но это говорит только о том, какие вкус был предпочтительнее, чем на сколько). Порядковые данные не могут быть использованы в параметрических тестах.

В тесте Пирсона используются данные об интервалах или соотношениях (числа с фиксированными интервалами, например, секунды, кг, мм). 1 мм не только меньше, чем 5 мм, но вы точно знаете, сколько на. этот тип данных может быть использован в параметрическом тесте.


1
Конечно, можно использовать параметрические модели - и, следовательно, параметрические тесты - с порядковыми данными. Нужно просто предложить распределение для этой переменной с конечным - и фиксированным - числом параметров, и некоторую подходящую гипотезу относительно этих параметров и вуаля , существует параметрический тест. Корреляция Пирсона, рассчитанная в ситуациях, когда одна или обе переменные имеют две категории (помечены двумя разными числами, обычно 0/1), приводит к обычно используемым показателям связи для этих ситуаций.
Glen_b
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.