R-квадрат в квантильной регрессии

Я использую квантильную регрессию, чтобы найти предикторы 90-го процентиля моих данных. Я делаю это в R, используя quantregпакет. Как я могу определить для квантильной регрессии, которая укажет, насколько изменчивость объясняется переменными предиктора? $r^2$

Что я действительно хочу знать: «Любой метод, который я могу использовать, чтобы найти, сколько изменчивости объясняется?». Уровни значимости по значениям P доступны в выходе команды: summary(rq(formula,tau,data)). Как я могу получить хорошее состояние?

r-squared quantile-regression

— rnso
источник

R^{2}

$R^2$ не имеет отношения к квантильной регрессии.

— whuber

@whuber: Любой альтернативный метод, который я могу использовать, чтобы выяснить, насколько изменчивость объясняется?

— rnso

Это было бы неплохо задать в теле вашего вопроса, а не в комментариях! «Объясненная изменчивость» (во всяком случае, измеряемая в терминах отклонений) является по существу концепцией наименьших квадратов; возможно, то, что вы хотите, - это подходящая мера статистической значимости или, возможно, добротность соответствия.

— whuber

Для любого достоинства вы должны подумать о том, что будет хорошей производительностью, что будет плохой работой, а что не имеет значения. Например, это не критика 90-го процентиля, если это паршивый предсказатель 10-го процентиля. Ваш тест может быть тем, что вы могли бы использовать, если бы вы не использовали квантильную регрессию. Если ваши предикторы непрерывны, это может быть трудно определить.

— Ник Кокс

@whuber: я добавил это в теле вопроса. Уровень значимости по значению P доступен в сводном (rq (формула, тау, данные)) выводе. Как я могу получить хорошее состояние?

— rnso

Ответы:

Koenker и Machado описывают , локальную меру качества соответствия в определенном ( ) квантиле. $^{[1]}$ $R^1$ $\tau$

Пусть $V(\tau) = \min_{b}\sum \rho_\tau(y_i-x_i'b)$

Пусть и будут оценками коэффициентов для полной модели и ограниченной модели, и пусть и будут соответствующие термины. $\hat{\beta}(\tau)$ $\tilde{\beta}(\tau)$ $\hat{V}$ $\tilde{V}$ $V$

Они определяют критерий соответствия . $R^1(\tau) = 1-\frac{\hat{V}}{\tilde{V} }$

Кенкер дает код для здесь , $V$

rho <- function(u,tau=.5)u*(tau - (u < 0))
V <- sum(rho(f$resid, f$tau))

Поэтому, если мы вычисляем для модели с использованием только перехвата ( - или в фрагменте кода ниже) и затем неограниченной модели ( ), мы можем вычислить это - по крайней мере, условно - чем-то похож на обычный . $V$ $\tilde{V}$ V0 $\hat{V}$ R1 <- 1-Vhat/V0 $R^2$

Изменить: В вашем случае, конечно, второй аргумент, который будет вставлен в, где f$tauнаходится в вызове во второй строке кода, будет любым значением, которое tauвы использовали. Значение в первой строке просто устанавливает значение по умолчанию.

«Объяснение отклонения от среднего значения» на самом деле не то, что вы делаете с квантильной регрессией, поэтому не стоит ожидать, что будет действительно эквивалентный показатель.

Я не думаю, что концепция хорошо переводит квантильную регрессию. Вы можете определить различные более или менее аналогичные величины, как здесь, но независимо от того, что вы выберете, у вас не будет большинства свойств, которые имеет в регрессии OLS. Вы должны четко понимать, какие свойства вам нужны, а какие нет - в некоторых случаях может быть возможно иметь показатель, который делает то, что вы хотите. $R^2$ $R^2$

$[1]$ Koenker, R and Machado, J (1999),
Goodness of Fit и связанные процессы вывода для квантильной регрессии,
журнал Американской статистической ассоциации, 94 : 448, 1296-1310.

— Glen_b - Восстановить Монику
источник

Должен ли тау = 0,9, а не 0,5?

— Дмитрий Васильевич Мастеров

Да, так и должно быть, но если вы предоставите правильный второй аргумент (как это сделано во второй строке, которую я цитировал выше), то вот как это работает. Значение 0,5 в первой строке является просто аргументом по умолчанию, если вы не укажете, tauкогда вызываете функцию. Я уточню в посте.

— Glen_b

@Glen_b Спасибо за объяснение. Если я не делаю глупостей, V представляется суммой взвешенных отклонений в оценочном квантиле, а не псевдо- .

R^{2}

$R^2$

— Дмитрий Владимирович Мастеров

@Dimitriy О, ты прав, я кое-что пропустил. Я исправлю это в ближайшее время.

— Glen_b

@Dimitriy Думаю, я исправил это сейчас.

— Glen_b

Мера псевдо- предложенная Koenker и Machado (1999) в JASA, измеряет степень соответствия, сравнивая сумму взвешенных отклонений для интересующей модели с той же суммой из модели, в которой появляется только пересечение. Рассчитывается как $R^2$

R_{1} (τ) = 1 - \frac{\sum_{y_{i} \geq {\hat{y}}_{i}} τ \cdot | y_{i} - {\hat{y}}_{i} | + \sum_{y_{i} < {\hat{y}}_{i}} (1 - τ) \cdot | y_{i} - {\hat{y}}_{i} |}{\sum_{y_{i} \geq \bar{y}} τ \cdot | y_{i} - \bar{y} | + \sum_{y_{i} < {\bar{y}}_{i}} (1 - τ) \cdot | y_{i} - \bar{y} |},

$R_1(\tau) = 1 - \frac{\sum_{y_i \ge \hat y_i} \tau \cdot \vert y_i-\hat y_i \vert +\sum_{y_i<\hat y_i} (1-\tau) \cdot \vert y_i-\hat y_i \vert}{\sum_{y_i \ge \bar y} \tau \cdot \vert y_i-\bar y \vert +\sum_{y_i<\bar y_i} (1-\tau) \cdot \vert y_i-\bar y \vert},$

где - подогнанный квантиль th для наблюдения , а - подогнанное значение только для перехвата модель. $\hat y_i =\alpha_{\tau}+\beta_{\tau}x$ $\tau$ $i$ $\bar y=\beta_{\tau}$

$R_1(\tau)$ должно лежать в , где 1 будет соответствовать идеальной подгонке, поскольку числитель, состоящий из взвешенной суммы отклонений, будет равен нулю. Это локальная мера соответствия для QRM, поскольку она зависит от , в отличие от глобального из OLS. Это, возможно, и является источником предупреждений об использовании этого: если ваша модель подходит к хвосту, нет гарантии, что она подходит в любом другом месте. Этот подход также может быть использован для сравнения вложенных моделей. $[0,1]$ $\tau$ $R^2$

Вот пример в R:

library(quantreg)
data(engel)

fit0 <- rq(foodexp~1,tau=0.9,data=engel)
fit1 <- rq(foodexp~income,tau=0.9,data=engel)

rho <- function(u,tau=.5)u*(tau - (u < 0))
R1 <- 1 - fit1$rho/fit0$rho

Это может быть выполнено более элегантно.

— Димитрий Васильевич Мастеров
источник

Ваша формула не отображается хорошо. После знака минус: R_1(\tau) = 1 - 􀀀последний символ - это какой-то беспорядок. Не могли бы вы проверить это? Может быть, вы вставили какой-то нестандартный символ вместо того, чтобы использовать текст

— Тим

@ Тим, я не вижу ничего странного ни в тексте, ни на экране.

— Дмитрий Васильевич Мастеров

Это похоже на Linux и Windows: snag.gy/ZAp5T.jpg

— Тим

@Tim Это поле ни к чему не относится, поэтому его можно игнорировать. Я постараюсь отредактировать его позже с другого компьютера.

— Дмитрий Васильевич Мастеров