Я знаком с понятием категориальных переменных и соответствующим фиктивным кодированием переменных, которое позволяет нам соответствовать одному уровню в качестве базовой линии, чтобы избежать коллинеарности. Я также знаком с тем, как интерпретировать оценки параметров из таких моделей: прогнозируемое изменение результата для заданного подогнанного уровня категориального предиктора относительно базовой категории.
В чем я не уверен, так это в том, как интерпретировать набор независимых переменных, пропорции которых равны единице . У нас снова есть коллинеарность, если мы подгоняем все пропорции в модели, поэтому, вероятно, нам придется оставить одну категорию в качестве базовой линии. Я также предполагаю, что посмотрю на SS типа III для общего теста значимости этой переменной. Тем не менее, как мы интерпретируем оценки параметров для этих уровней, которые соответствуют модели, и которые считаются базовыми?
Пример . На уровне почтового индекса независимой переменной является доля метаморфических, магматических и осадочных пород. Как вы, возможно, знаете, это три основных типа пород, и все породы классифицируются как один из них. Таким образом, пропорции по всем трем сумм равны 1. Результатом является средний уровень радона в соответствующем почтовом индексе.
Если бы я подходил, скажем, к метаморфическим и магматическим пропорциям в качестве предикторов в модели, оставляя осадочные отложения в качестве базовой линии, общий тип III F F- теста из двух подобранных уровней будет означать, является ли тип породы в целом важным предиктор результата (средний уровень радона). Затем я мог бы посмотреть на отдельные значения p (на основе распределения t ), чтобы определить, значительно ли один или оба типа пород отличались от базовой линии.
Тем не менее, когда дело доходит до оценок параметров, мой мозг все еще хочет интерпретировать их как предсказанное изменение результатов между группами (типы камней), и я не понимаю, как включить тот факт, что они соответствуют пропорциям ,
Если оценка для метаморфизма составляла, скажем, 0,43, интерпретация не просто в том, что прогнозируемый средний уровень радона увеличивается на 0,43 единицы, когда порода метаморфическая по сравнению с осадочной. Тем не менее, интерпретация также не просто для некоторого увеличения единицы (скажем, 0,1) в пропорции метаморфического типа породы, потому что это не отражает тот факт, что это также относительно базовой линии ( осадочные ), и, кроме того, это изменение пропорция метаморфизма по своей сути меняет пропорцию подгонки другого уровня породы в модели, магматической .
Есть ли у кого-нибудь источник, который дает толкование такой модели, или вы могли бы привести здесь краткий пример, если нет?