Вопросы с тегом «multicollinearity»

Ситуация, когда существует сильная линейная связь между предикторными переменными, так что их корреляционная матрица становится (почти) единственной. Это «плохое состояние» затрудняет определение уникальной роли, которую играет каждый из предикторов: возникают проблемы с оценкой и увеличиваются стандартные ошибки. Двусторонние очень высококоррелированные предикторы являются одним примером мультиколлинеарности.

1
Интерпретация пропорций, суммирующих единицу, как независимых переменных в линейной регрессии
Я знаком с понятием категориальных переменных и соответствующим фиктивным кодированием переменных, которое позволяет нам соответствовать одному уровню в качестве базовой линии, чтобы избежать коллинеарности. Я также знаком с тем, как интерпретировать оценки параметров из таких моделей: прогнозируемое изменение результата для заданного подогнанного уровня категориального предиктора относительно базовой категории. В чем …

3
Что является примером совершенной мультиколлинеарности?
Что является примером идеальной коллинеарности с точки зрения матрицы дизайна ?XXX Я хотел бы привести пример, в котором не может быть оценен, потому что не является обратимым.β^=(X′X)−1X′Yβ^=(X′X)−1X′Y\hat \beta = (X'X)^{-1}X'Y(X′X)(X′X)(X'X)

2
Дисперсионно-ковариационная матричная интерпретация
Предположим, у нас есть линейная модель Model1и vcov(Model1)дает следующую матрицу: (Intercept) latitude sea.distance altitude (Intercept) 28.898100 -23.6439000 -34.1523000 0.50790600 latitude -23.643900 19.7032500 28.4602500 -0.42471450 sea.distance -34.152300 28.4602500 42.4714500 -0.62612550 altitude 0.507906 -0.4247145 -0.6261255 0.00928242 Для этого примера, что на самом деле отображает эта матрица? Какие предположения мы можем безопасно сделать …

1
Есть ли проблема с мультиколлинеарностью и регрессией сплайнов?
При использовании естественных (то есть ограниченных) кубических сплайнов созданные базовые функции являются в высокой степени коллинеарными, и при использовании в регрессии, по-видимому, они дают очень высокую статистику VIF (дисперсионный коэффициент инфляции), сигнализируя о мультиколлинеарности. Когда кто-то рассматривает случай модели для целей прогнозирования, это проблема? Кажется, что так будет всегда из-за …

5
Уменьшает ли стандартизация независимых переменных коллинеарность?
Я наткнулся на очень хороший текст о Bayes / MCMC. ИТ-специалисты предполагают, что стандартизация ваших независимых переменных сделает алгоритм MCMC (Metropolis) более эффективным, но также может снизить (мульти) коллинеарность. Это может быть правдой? Это то, что я должен делать как стандарт . (Извините). Крушке 2011, Анализ байесовских данных. (AP) редактировать: …

2
Как начать строить регрессионную модель, когда наиболее сильно ассоциированный предиктор является двоичным
У меня есть набор данных, содержащий 365 наблюдений трех переменных, а именно pm, tempи rain. Теперь я хочу проверить поведение pmв ответ на изменения в двух других переменных. Мои переменные: pm10 = Ответ (зависимый) temp = предиктор (независимый) rain = предиктор (независимый) Ниже приведена корреляционная матрица для моих данных: > …

3
Каковы преимущества различных подходов к обнаружению коллинеарности?
Я хочу определить, является ли коллинеарность проблемой в моей регрессии МНК. Я понимаю, что факторы инфляции дисперсии и индекс состояния являются двумя часто используемыми показателями, но мне трудно найти что-то определенное с точки зрения достоинств каждого подхода или какими должны быть оценки. Известный источник, который указывает, какой подход и / …

5
Что делать с коллинеарными переменными
Отказ от ответственности: это для домашнего проекта. Я пытаюсь найти лучшую модель для цен на алмазы, в зависимости от нескольких переменных, и у меня пока что есть довольно хорошая модель. Однако я столкнулся с двумя переменными, которые явно коллинеарны: >with(diamonds, cor(data.frame(Table, Depth, Carat.Weight))) Table Depth Carat.Weight Table 1.00000000 -0.41035485 0.05237998 …

2
Коллинеарность между категориальными переменными
Есть много о коллинеарности в отношении непрерывных предикторов, но не так много, что я могу найти в категориальных предикторах. У меня есть данные этого типа, показанные ниже. Первый фактор - это генетическая переменная (количество аллелей), второй фактор - категория заболевания. Ясно, что гены предшествуют заболеванию и являются фактором, демонстрирующим симптомы, …

1
Ссылка на сумму и разность высококоррелированных переменных, почти не коррелированных
В статье, которую я написал, я моделирую случайные величины и а не и чтобы эффективно устранить проблемы, возникающие, когда и сильно коррелированы и имеют одинаковую дисперсию (как в моем приложении). Судьи хотят, чтобы я дал ссылку. Я мог бы легко доказать это, но, будучи журналом приложений, они предпочитают ссылку на …

1
Чувствительна ли машина опорных векторов к корреляции между атрибутами?
Я хотел бы обучить SVM для классификации дел (ИСТИНА / ЛОЖЬ) на основе 20 атрибутов. Я знаю, что некоторые из этих атрибутов тесно взаимосвязаны. Поэтому мой вопрос: чувствителен ли SVM к корреляции или избыточности между функциями? Любая ссылка?

1
Коэффициент дисперсии инфляции для обобщенных аддитивных моделей
В обычном расчете VIF для линейной регрессии каждая независимая / пояснительная переменная рассматривается как зависимая переменная в обычной регрессии наименьших квадратов. т.е.ИксJXjX_j ИксJ= β0+ ∑я = 1 , я ≠ jNβяИксяИксJзнак равноβ0+Σязнак равно1,я≠JNβяИкся X_j = \beta_0 + \sum_{i=1, i \neq j}^n \beta_i X_i Значения сохраняются для каждой из регрессий, а …

3
Линейная связь между объясняющими переменными в множественной регрессии
Я читал главу о множественной регрессии « Анализ данных и графика с использованием R: подход на основе примеров» и был немного озадачен, обнаружив, что он рекомендует проверять линейные отношения между объясняющими переменными (используя диаграмму рассеяния) и, в случае отсутствия ' т любой, превращая их таким образом , они действительно становятся …

2
Является ли мультиколлинеарность неявной в категориальных переменных?
Я заметил, что во время работы с моделью многомерной регрессии наблюдался небольшой, но заметный эффект мультиколлинеарности, измеряемый коэффициентами инфляции дисперсии, в категориях категориальной переменной (конечно, после исключения эталонной категории). Например, скажем, у нас есть набор данных с непрерывной переменной y и одной номинальной категориальной переменной x, которая имеет k возможных …

3
Определение статистической значимости коэффициента линейной регрессии при наличии мультиколлинеарности
Предположим, у меня есть несколько городов с разной численностью населения, и я хотел узнать, существует ли положительная линейная зависимость между количеством винных магазинов в городе и количеством DUI. Где я определяю, является ли эта связь значимой или нет, основываясь на t-критерии предполагаемого коэффициента регрессии. Теперь четко поп. размер города будет …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.