Я нашел ссылку в статье, которая выглядит так:
Согласно Tabachnick & Fidell (1996), независимые переменные с двумерной корреляцией более 0,70 не должны включаться в множественный регрессионный анализ.
Проблема: я использовал в дизайне множественной регрессии 3 переменные, коррелированные> 0,80, VIF около 0,2-2,3, Допуск ~ 4-5. Я не могу исключить ни одну из них (важные предикторы и результаты). Когда я регрессировал результат по двум предикторам, которые коррелировали на 0,80, они оставались как значимыми, так и по каждой предсказанной важной дисперсии, и эти же две переменные имеют наибольшую часть и коэффициенты полупериодической корреляции среди всех 10 включенных переменных (5 контролей).
Вопрос: Является ли моя модель действительной, несмотря на высокие корреляции? Любые ссылки приветствуются!
Спасибо за ответы!
Я не использовал Табачника и Фиделла в качестве ориентира, я нашел эту ссылку в статье, посвященной высокой коллинеарности среди предикторов.
Так что, по сути, у меня слишком мало наблюдений за количеством предикторов в модели (многие категориальные, фиктивно-кодированные контрольные переменные - возраст, срок пребывания, пол и т. Д.) - 13 переменных для 72 случаев. Индекс условий составляет ~ 29 со всеми элементами управления и ~ 23 без них (5 переменных).
Я не могу отбросить любую переменную или использовать факторный анализ, чтобы объединить их, потому что теоретически они имеют смысл сами по себе. Уже слишком поздно, чтобы получить больше данных. Поскольку я провожу анализ в SPSS, возможно, было бы лучше найти синтаксис для регрессии гребня (хотя я раньше этого не делал, и интерпретация результатов была бы для меня новой).
Если это имеет значение, когда я проводил ступенчатую регрессию, те же 2 высоко коррелированные переменные оставались единственными значимыми предикторами результата.
И я до сих пор не понимаю, имеют ли значение частичные корреляции, которые высоки для каждой из этих переменных, как объяснение того, почему я сохранил их в модели (если регрессия гребня не может быть выполнена).
Не могли бы вы сказать, что «Диагностика регрессии: выявление влиятельных данных и источников коллинеарности / Дэвид А. Белсли, Эдвин Кух и Рой Уэлш, 1980» будет полезна для понимания мультиколлинеарности? Или другие ссылки могут быть полезны?