Не желая отдавать должное ответу @ttnphns, я хотел убрать ответ из комментариев (особенно учитывая, что ссылка на статью исчезла). Ответ Мэтта Краузе дает полезное обсуждение различия между и но не обсуждает решение о том, какую формулу использовать в любом конкретном случае.р2р2дJр2дJ
Как я обсуждаю в этом ответе , Инь и Фан (2001) дают хороший обзор множества различных формул для оценки дисперсии населения, объясненных , которые все могут потенциально быть помечены как тип скорректированного .ρ2р2
Они выполняют моделирование для оценки того, какая из широкого диапазона скорректированных формул r-квадрата обеспечивает наилучшую несмещенную оценку для разных размеров выборки, и взаимосвязей предикторов. Они предполагают, что формула Пратта может быть хорошим вариантом, но я не думаю, что исследование было окончательным по этому вопросу.ρ2
Обновление: Раджу и др. (1997) отмечают, что скорректированные формулы различаются в зависимости от того, предназначены ли они для оценки скорректированных предположении фиксированных х или случайных х предикторов. В частности, формула Эзекиала предназначена для оценки в контексте фиксированного x, а формулы Олкина-Пратта и Пратта предназначены для оценки в контексте случайного x. Между формулами Олкина-Пратта и Пратта нет большой разницы. Предположения с фиксированной x совпадают с запланированными экспериментами, а предположения случайной x совпадают с предположением, что значения переменных-предикторов являются выборкой возможных значений, как это обычно бывает в наблюдательных исследованиях. Смотрите этот ответ для дальнейшего обсужденияр2р2ρ2ρ2, Также нет большой разницы между этими двумя типами формул, поскольку размеры выборки становятся умеренно большими (см. Здесь для обсуждения размера разницы ).
Краткое изложение правил большого пальца
- Если вы предполагаете, что ваши наблюдения для переменных-предикторов являются случайной выборкой из совокупности, и вы хотите оценить для полной совокупности как предикторов, так и критерия (т. Е. Предположения случайного х), используйте формулу Олкина-Пратта (или формула Пратта).ρ2
- Если вы предполагаете, что ваши наблюдения фиксированы или вы не хотите обобщать за пределы наблюдаемых вами уровней предиктора, то оцените по формуле Иезекииля.ρ2
- Если вы хотите узнать о прогнозировании вне выборки, используя уравнение регрессии выборки, то вам следует изучить некоторую форму процедуры перекрестной проверки.
Ссылки
- Раджу Н.С., Билгик Р., Эдвардс Дж. И Флер П.Ф. (1997). Обзор методологии: оценка достоверности и перекрестной достоверности населения и использование равных весов при прогнозировании. Прикладные психологические измерения, 21 (4), 291-305.
- Инь, П. & Фан, X. (2001). Оценкаусадки R 2 при множественной регрессии: сравнение различных аналитических методов. Журнал экспериментального образования, 69 (2), 203-224. PDFр2