Я не думаю, что название вашего вопроса точно отражает то, что вы просите.
Вопрос о том, как интерпретировать параметры в GLM, очень широк, потому что GLM - очень широкий класс моделей. Напомним, что GLM моделирует переменную отклика которая, как предполагается, следует известному распределению из экспоненциального семейства, и что мы выбрали обратимую функцию g такую, что
E [ yyg
для J переменных-предикторов x . В этой модели интерпретация любого конкретного параметра β j - это скорость изменения g ( y ) по отношению к x j . Определить μ ≡ E [ y
E[y|x]=g−1(x0+x1β1+⋯+xJβJ)
Jxβjg(y)xj и
η≡x⋅β,чтобы сохранить обозначение в чистоте. Тогда для любого
j∈{1,…,J},
β j = ∂μ≡E[y|x]=g−1(x)η≡x⋅βj∈{1,…,J}
Теперь определим
ejкак вектор изнулей
J-1и одного
1в
j-й позиции, так что, например, если
J=5,то
e3=(0,0,1,0,0). Тогда
βj=g(E [ yβj=∂η∂xj=∂g(μ)∂xj.
ejJ−11jJ=5e3=(0,0,1,0,0)βj=g(E[y|x+ej])−g(E[y|x])
Что просто означает, что - это влияние на η единичного увеличения x j .βjηxj
Вы также можете указать отношения следующим образом:
и
E[y
∂E[y|x]∂xj=∂μ∂xj=dμdη∂η∂xj=∂μ∂ηβj=dg−1dηβj
E[y|x+ej]−E[y|x]≡Δjy^=g−1((x+ej)β)−g−1(xβ)
Не зная ничего о , это насколько мы можем получить. β j - это влияние на η , на преобразованное условное среднее значение y единичного увеличения x j , а влияние на условное среднее y для единичного увеличения x j составляет g - 1 ( β ) .gβjηyxjyxjg−1(β)
Но вы, кажется, спрашиваете конкретно о регрессии Пуассона, используя стандартную функцию R по умолчанию, которая в данном случае является натуральным логарифмом. Если это так, вы спрашиваете о конкретном виде ГЖС , в которой и г = Ln . Тогда мы можем получить некоторую тягу в отношении конкретной интерпретации.y∼Poisson(λ)g=ln
Из того, что я сказал выше, мы знаем, что ∂μ∂xj=dg−1dηβj. And since we know g(μ)=ln(μ), we also know that g−1(η)=eη. We also happen to know that deηdη=eη, so we can say that
∂μ∂xj=∂E[y|x]∂xj=ex0+x1β1+⋯+xJβJβj
which finally means something tangible:
Given a very small change in xj, the fitted y^ changes by y^βj.
Note: this approximation can actually work for changes as large as 0.2, depending on how much precision you need.
And using the more familiar unit change interpretation, we have:
Δjy^=ex0+x1β1+⋯+(xj+1)βj+⋯+xJβJ−ex0+x1β1+⋯+xJβJ=ex0+x1β1+⋯+xJβJ+βj−ex0+x1β1+⋯+xJβJ=ex0+x1β1+⋯+xJβJeβj−ex0+x1β1+⋯+xJβJ=ex0+x1β1+⋯+xJβJ(eβj−1)
which means
Given a unit change in xj, the fitted y^ changes by y^(eβj−1).
There are three important pieces to note here:
- The effect of a change in the predictors depends on the level of the response.
- An additive change in the predictors has a multiplicative effect on the response.
- You can't interpret the coefficients just by reading them (unless you can compute arbitrary exponentials in your head).
So in your example, the effect of increasing pH by 1 is to increase lny^ by y^(e0.09−1); that is, to multiply y^ by e0.09≈1.09. It looks like your outcome is the number of darters you observe in some fixed unit of time (say, a week). So if you're observing 100 darters a week at a pH of 6.7, raising the pH of the river to 7.7 means you can now expect to see 109 darters a week.