R 2 R 2 R 2R2 сравнивает соответствие выбранной модели с горизонтальной прямой (нулевая гипотеза). Если выбранная модель подходит хуже, чем горизонтальная линия, то является отрицательным. Обратите внимание, что не всегда является квадратом чего-либо, поэтому он может иметь отрицательное значение, не нарушая никаких правил математики. отрицателен только тогда, когда выбранная модель не следует тренду данных, поэтому подходит хуже, чем горизонтальная линия.R2R2R2
Пример: подгонка данных к модели линейной регрессии, ограниченной так, чтобы должно было равняться .1500Y1500
Модель не имеет никакого смысла, учитывая эти данные. Это явно неправильная модель, возможно, выбранная случайно.
Подгонка модели (прямая, ограниченная проходом через точку (0,1500)) хуже, чем подгонка горизонтальной линии. Таким образом, сумма квадратов из модели больше, чем сумма квадратов из горизонтальной линии . вычисляется как . Когда больше, чем , это уравнение вычисляет отрицательное значение для .( S S tot ) R 2 1 - S S reg(SSreg)(SStot)R2 SSregSStotR21−SSregSStotSSregSStotR2
При линейной регрессии без ограничений должно быть положительным (или нулевым) и равно квадрату коэффициента корреляции . Отрицательное значение возможно только при линейной регрессии, когда ограничены либо точка пересечения, либо наклон, так что линия «наилучшего соответствия» (с учетом ограничения) подходит хуже, чем горизонтальная линия. При нелинейной регрессии может быть отрицательным, когда модель наилучшего соответствия (с учетом выбранного уравнения и его ограничений, если таковые имеются) соответствует данным, которые хуже горизонтальной линии. r R 2 R 2R2rR2R2
Итог: отрицательный не является математической невозможностью или признаком компьютерной ошибки. Это просто означает, что выбранная модель (с ее ограничениями) очень плохо вписывается в данные.R2