Каков интуитивный смысл наличия линейных отношений между логами двух переменных?


20

У меня есть две переменные, которые не показывают большой корреляции при построении графика друг против друга, как есть, но очень четкие линейные отношения, когда я строю журналы каждой переменной против другой.

Таким образом, я бы в конечном итоге с моделью типа:

log(Y)=alog(X)+b
, что математически здорово, но, похоже, не имеет объяснительного значения регулярной линейной модели.

Как я могу интерпретировать такую ​​модель?


5
Мне нечего добавить к существующим ответам, но логарифм в результате и предиктор - это эластичность. Поиск этого термина должен найти хорошие источники для интерпретации этих отношений, что не очень интуитивно понятно.
Upper_Case-Stop Harm Моника

Интерпретация модели log-log, где зависимой переменной является log (y), а независимой переменной является log (x), равна: %Δ=β1%Δx .
Боб

3
Дополнительная логарифмическая ссылка является идеальной спецификацией GLM, когда результат является бинарным (модель риска), а воздействие является кумулятивным, например, число половых партнеров против ВИЧ-инфекции. jstor.org/stable/2532454
AdamO

2
@ Алексис, вы можете увидеть липкие точки, если наложите кривые. Попробуй curve(exp(-exp(x)), from=-5, to=5)против curve(plogis(x), from=-5, to=5). Вогнутость ускоряется. Если риск события от одного столкновения был p , то риск после второго события должен быть 1(1p)2 и т. Д., Это вероятностная форма, логит не будет зафиксирован. Высокие высокие воздействия могут искажать результаты логистической регрессии более резко (ложно в соответствии с предыдущим правилом вероятности). Некоторое моделирование покажет вам это.
AdamO

1
@AdamO Вероятно, будет написана педагогическая статья, включающая в себя такую ​​симуляцию, которая мотивирует, как выбрать конкретную дихотомическую ссылку на результат из трех, включая ситуации, когда это имеет значение и не имеет значения.
Алексис

Ответы:


27

Вам просто нужно взять экспоненту обеих сторон уравнения, и вы получите потенциальное соотношение, которое может иметь смысл для некоторых данных.

log(Y)=alog(X)+b

exp(log(Y))=exp(alog(X)+b)

Y=ebXa

И поскольку - это просто параметр, который может принимать любое положительное значение, эта модель эквивалентна:eb

Y=cXa

Следует отметить, что выражение модели должно включать термин ошибки, и это изменение переменных оказывает на него интересное влияние:

log(Y)=alog(X)+b+ϵ

Yзнак равноебИксaехр(ε)

То есть ваша модель с аддитивными ошибками в соответствии с условиями для OLS (нормально распределенные ошибки с постоянной дисперсией) эквивалентна потенциальной модели с мультипликативными ошибками, чей логарифм следует нормальному распределению с постоянной дисперсией.


3
OP может быть интересно узнать, что у этого дистрибутива есть имя, лог-нормальное: en.wikipedia.org/wiki/Log-normal_distribution
gardenhead

2
Как насчет влияния неравенства Дженсена? Обычно для выпуклых g,E[g(X)]g(E[X])
статистика

14

Вы можете взять вашу модель и вычислить полный дифференциал, в результате вы получите что-то вроде: который уступает журнал(Y)знак равноaжурнал(Икс)+б

1YdYзнак равноa1ИксdИкс
dYdИксИксYзнак равноa

Следовательно , один простая интерпретация коэффициента будет процентным изменением в для процентного изменения в . Из этого следует , кроме того , что переменная наросты на постоянной фракции ( ) от скорости роста .aYИксYЙaИкс


Так что, если график log-log является линейным, это будет означать постоянную скорость роста?
Дмитрий Васильевич Мастеров

Фактически, темп роста будет постоянным тогда и только тогда, когда . Yaзнак равно0
RScrlli

Не со временем темпы роста относительно роста в х.
Дмитрий Васильевич Мастеров

переупорядочение не помогает, я бы удалил его
Аксакал

1
@ DimitriyV.Masterov Ok, то так как , линейный по , это означает , что переменная возрастает при постоянной доле скорости роста . Что-то не так с моим ответом по вашему мнению? журнал(Y)журнал(Икс)YИкс
RScrlli

7

Интуитивно понятно, что дает нам порядок величины переменной, поэтому мы можем рассматривать отношения, поскольку порядки величин двух переменных линейно связаны. Например, увеличение предиктора на один порядок может быть связано с увеличением отклика на три порядка.log

При построении графика с использованием log-log мы надеемся увидеть линейную зависимость. Используя пример из этого вопроса , мы можем проверить предположения линейной модели:

логарифмическая


3
+1 за интуитивный ответ на не интуитивную концепцию. Однако изображение, которое вы включили, явно нарушает постоянную дисперсию ошибок по всему предиктору.
Франс Роденбург

1
Ответ правильный, но авторство неверно. Изображение не должно быть связано с Google Images, но, по крайней мере, с веб-страницей, где его можно найти, что можно узнать, просто нажав на изображения Google.
Pere

@ К сожалению, я не могу найти исходный источник изображения, к сожалению (по крайней мере, с помощью обратного поиска изображения)
qwr

Это , кажется, выходит родом из diagramss.us , хотя это сайт вниз и большинство его страниц не в веб - архиве помимо своей домашней странице
Генри

4

Примиряя ответ @Rscrill с фактическими дискретными данными, рассмотрим

журнал(YT)знак равноaжурнал(ИксT)+б,журнал(YT-1)знак равноaжурнал(ИксT-1)+б

журнал(YT)-журнал(YT-1)знак равноa[журнал(ИксT)-журнал(ИксT-1)]

Но

журнал(YT)-журнал(YT-1)знак равножурнал(YTYT-1)журнал(YT-1+ΔYTYT-1)знак равножурнал(1+ΔYTYT-1)

ΔYTYT-1 - это процентное изменение между периодами и или темп роста , скажем, . Когда он меньше , мы имеем приемлемое приближениеYT-1TYTграммYT0,1

журнал(1+ΔYTYT-1)ΔYTYT-1знак равнограммYT

Поэтому мы получаем

граммYTaграммИксT

что подтверждает в эмпирических исследованиях теоретическую трактовку @Rscrill.


1
Это, вероятно, то, что математик назвал бы интуитивным :)
Ричард Харди

2

Линейная зависимость между бревнами эквивалентна степенной зависимости: В физике такое поведение означает, что система не масштабируется или не масштабируется . Например, если - это расстояние или время, это означает, что зависимость от не может быть охарактеризована характерной длиной или шкалой времени (в отличие от экспоненциальных затуханий). В результате, такая система обладает дальней зависимостью на .

Y~Иксα
ИксИксYИкс

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.