При работе со многими входными переменными нас часто беспокоит мультиколлинеарность . Существует ряд мер мультиколлинеарности, которые используются для обнаружения, анализа и / или передачи мультиколлинеарности. Некоторые общие рекомендации:
- Кратный для конкретной переменной
- Допуск, , для конкретной переменной
- Коэффициент инфляции дисперсии, , для конкретной переменной
Номер условия проектирования матрицы в целом:
(Есть несколько других вариантов, обсуждаемых в статье в Википедии, и здесь на SO в контексте R.)
Тот факт, что первые три являются идеальной функцией друг друга, говорит о том, что единственным возможным чистым преимуществом между ними было бы психологическое. С другой стороны, первые три позволяют вам изучать переменные по отдельности, что может быть преимуществом, но я слышал, что метод числа условий считается лучшим.
- Это правда? Лучше всего для чего?
- Является ли число условий идеальной функцией ? (Я думаю, что это будет.)
- Люди находят, что один из них легче всего объяснить? (Я никогда не пытался объяснить эти числа вне класса, я просто даю качественное описание мультиколлинеарности.)