Как преобразовать стандартизированные коэффициенты в нестандартные коэффициенты?

Моя цель состоит в том, чтобы использовать коэффициенты, полученные в ходе предыдущих исследований по этому вопросу, для прогнозирования фактических результатов с учетом набора независимых переменных. Тем не менее, в исследовательской работе перечислены только бета-коэффициенты и t-значение. Я хотел бы знать, возможно ли преобразовать стандартизированные коэффициенты в нестандартные.

Было бы полезно преобразовать мои нестандартные независимые переменные в стандартизированные, чтобы вычислить прогнозируемое значение? Как бы я вернулся к нестандартному прогнозируемому значению (если это вообще возможно ...)

Добавлен образец строки из бумаги:

Номер автобусного маршрута (buslines) | 0,275 (бета) | 5,70 *** (т-значение)

Мне также дают это относительно независимых переменных:

Номер автобусного маршрута (buslines) | 12,56 (средняя) | 9.02 (Стандарт) | 1 (мин) | 53 (макс)

regression-coefficients

Как были стандартизированы коэффициенты? В общем, у есть единица, которая является единицей деленной на единицу , какова их единица в статье?

β

$\beta$

Y

$Y$

X

$X$

— gui11aume

Я не уверен, что понимаю ваш вопрос. Вот пример строки независимой переменной после регрессионного анализа из статьи. Характеристика транзитных поставок: Количество автобусных маршрутов (buslines) | 0,275 (бета) | 5,70 *** (t-значение)

Сам коэффициент не стандартизирован, как указано выше. Но t статистика это оценочный коэффициент, деленный на его расчетное стандартное отклонение. Учитывая t и степени свободы, вы можете рассчитать значение p и расчетное стандартное отклонение, потому что Beta = t-значение x расчетное стандартное отклонение. Но я не уверен, что это то, что вы ищете. Бета-оценка не стандартизирована. Статистика t является стандартизированной формой оценки биений. Таким образом, у вас уже есть стандартизированный коэффициент.

— Майкл Р. Черник

Ответы:

Похоже, что бумага использует модель множественной регрессии в форме

Y знак равно β_{0} + \underset{я}{Σ} β_{я} ξ_{я} + ε

$Y = \beta_0 + \sum_i \beta_i \xi_i + \varepsilon$

где - стандартизированные версии независимых переменных; а именно , $\xi_i$

ξ_{я} знак равно \frac{{Икс}_{я} - м_{я}}{s_{я}}

$\xi_i = \frac{x_i - m_i}{s_i}$

лозы средний (например, 12.56 в примере) и стандартного отклонения (например, 9.02 в примере) значений переменной ( «Шинопроводов» в данном примере). - это перехват (если есть). Подсоединение этого выражения к подогнанной модели с его «бета-версиями», записанными как (0.275 в примере), и выполнение некоторой алгебры дает оценки $m_i$ $s_i$ $i^\text{th}$ $x_i$ $\beta_0$ $\hat{\beta_i}$

\hat{Y} знак равно \hat{β_{0}} + \underset{я}{Σ} \hat{β_{я}} \frac{{Икс}_{я} - м_{я}}{s_{я}} знак равно (\hat{β_{0}} - (\underset{я}{Σ} \frac{\hat{β_{я} м_{я}}}{s_{я}})) + \underset{я}{Σ} (\frac{\hat{β_{я}}}{s_{я}}) {Икс}_{я},

$\hat{Y} = \hat{\beta_0} + \sum_i \hat{\beta_i} \frac{x_i - m_i}{s_i}=\left(\hat{\beta_0}-\left(\sum_i\frac{\hat{\beta_i m_i}}{s_i}\right)\right)+\sum_i\left(\frac{\hat{\beta_i}}{s_i}\right)x_i.$

Это показывает, что коэффициенты в модели (кроме постоянного члена) получаются путем деления бета на стандартные отклонения независимых переменных, и что пересечение корректируется путем вычитания подходящей линейной комбинации бета. $x_i$

Это дает вам два способа предсказать новое значение из вектора независимых значений: $(x_1, \ldots, x_p)$

Используя средства $m_i$ и стандартные отклонения представленные в статье (не пересчитанные по каким-либо новым данным!), Рассчитайте и их в формулу регрессии в соответствии с бета-версиями или, что эквивалентно, $s_i$ $(\xi_1,\ldots, \xi_p) = ((x_1-m_1)/s_1, \ldots, (x_p-m_p)/s_p)$
Вставьте в алгебраически эквивалентную формулу, полученную выше. $(x_1, \ldots, x_p)$

Если в статье используется обобщенная линейная модель , вам может потребоваться выполнить это вычисление, применив обратную функцию «ссылка» для . Например, при логистической регрессии необходимо применять логистическую функцию чтобы получить прогнозируемую вероятность $\hat{Y}$ $1/(1 + \exp(-\hat{Y}))$ ( - прогнозируемые шансы журнала). $\hat{Y}$

— Whuber
источник

Отлично спасибо! Получил некоторую помощь от коллеги. Еще один вопрос: мое новое значение (Y-шляпа) очень низкое. Автор использует логарифмически преобразованную зависимую переменную в своей регрессии. Означает ли это, что я должен exp (Y-шляпа), чтобы расширить обратно до нетрансформированной единицы измерения.

Кроме того, в статье нет Y-перехвата, и тестирование метода exp (Y-hat), кажется, указывает на то, что должно быть значение для Y-перехвата, которое представляет некоторую дисперсию, не объясненную моделью, в порядке поднять прогнозируемый результат до разумного уровня.

Тогда это не коэффициенты, которые стандартизированы. Это переменные.

— Майкл Р. Черник

\exp (\hat{y})

$\exp(\hat{y})$

Если вы хотите сделать то, что просит заголовок, посмотрите здесь: www3.nd.edu/~rwilliam/stats1/x92.pdf, если y также стандартизирован. Также см. Stats.stackexchange.com/questions/235057/…

— Крис

В знак равно п \times \frac{s Y}{s Икс}

$B = p \times \frac{sy}{sx}$

— копье
источник

Я не уверен, что такое коэффициент пути. Похоже, что B - это коэффициент регрессии, который не был бы безразмерным. Это будет в у единиц на 1 единицу. Однако p = B sx / sy, где sx - расчетное стандартное отклонение по x, деленное на расчетное стандартное отклонение по y, а p безразмерно. Это представляет приблизительную корреляцию между x и y. Ланс, если это то, что вы хотели, внесите изменения, отредактировав свой пост.

— Михаил Р. Черник