В Факторном анализе (или в PCA), что означает загрузку фактора больше 1?

10

Я только что запустил FA, используя наклонное вращение (promax), и элемент дал коэффициент загрузки 1,041 для одного фактора (и коэффициент загрузки -131, -.119 и .065 для других факторов с использованием матрицы шаблонов ) , И я не уверен, что это значит, я думал, что это может быть только между -1 и 1.

Это связано с наклонным вращением? И может ли нагрузка превышать 1 с ортогональными факторами?

pca factor-analysis factor-rotation

— Родриго М. Росалес
источник

10

Кто вам сказал, что коэффициент загрузки не может быть больше 1? Это может случится. Особенно с сильно коррелированными факторами.

Этот отрывок из отчета известного пионера SEM об этом в значительной степени подводит итог:

«Это недоразумение, вероятно, связано с классическим исследовательским анализом факторов, где загрузки факторов являются корреляциями, если анализируется матрица корреляции, а факторы стандартизированы и некоррелированы (ортогональны). Однако, если факторы коррелированы (наклонны), загрузки факторов являются коэффициентами регрессии и не корреляции, и как таковые они могут быть больше, чем один по величине. "

— мамаша
источник

5

Нагрузка в факторном анализе или в PCA ( см. 1 , см. 2 , см. 3 ) представляет собой коэффициент регрессии, вес в линейной комбинации, предсказывающий переменные (элементы) по стандартизированным (дисперсиям единицы) факторам / компонентам.

Причины превышения нагрузки $1$ :

Причина 1: проанализирована ковариационная матрица. Если анализировались стандартизированные переменные, то есть анализ основывался на корреляционной матрице, то после извлечения или после ортогонального вращения (такого как варимакс) - когда факторы / компоненты остаются некоррелированными - нагрузки также являются коэффициентами корреляции. Это свойство линейного уравнения регрессии: с ортогональными стандартизированными предикторами параметры равны корреляциям Пирсона. Таким образом, в таком случае загрузка не может быть выше [-1, 1].

Но если анализировать были только центрированные переменные, то есть анализ был основан на ковариационной матрице, то нагрузки не должны ограничиваться [-1, 1], потому что коэффициенты регрессии в такой модели не обязательно должны быть равны коэффициентам корреляции. На самом деле это ковариации. Обратите внимание, что это были необработанные загрузки. Существуют «масштабированные» или «стандартизированные» загрузки (описанные в ссылках, которые я дал в 1-м абзаце), которые масштабируются, чтобы не покидать полосу [-1, 1].

Причина 2: наклонное вращение. После наклонного вращения, такого как promax или oblimin, у нас есть два типа нагрузок: матричная структура (коэффициенты регрессии или нагрузки как таковые) и структурная матрица (коэффициенты корреляции). Они не равны друг другу по причине, приведенной выше: коэффициенты регрессии коррелированных предикторов отличаются от корреляций Пирсона. Таким образом, загрузка шаблона может легко лежать за пределами [-1, 1]. Обратите внимание, что это верно даже тогда, когда матрица корреляции была анализируемой матрицей. Так вот, когда факторы / компоненты косые.

Причина 3 (редко): дело Хейвуда. Случай Хейвуда ( pt 6 ) представляет собой сложность в алгоритмах факторного анализа, когда на итерациях загрузка превышает теоретически допустимую величину - это происходит, когда общность выходит за пределы дисперсии. Случай Хейвуда - редкая ситуация, которая встречается в некоторых наборах данных, как правило, когда слишком мало переменных для поддержки запрошенного числа факторов. Программы сообщают, что существует ошибка в случае Heywood, и либо останавливаются, либо пытаются ее устранить.

— ttnphns
источник