Нагрузка в факторном анализе или в PCA ( см. 1 , см. 2 , см. 3 ) представляет собой коэффициент регрессии, вес в линейной комбинации, предсказывающий переменные (элементы) по стандартизированным (дисперсиям единицы) факторам / компонентам.
Причины превышения нагрузки 1:
Причина 1: проанализирована ковариационная матрица.
Если анализировались стандартизированные переменные, то есть анализ основывался на корреляционной матрице, то после извлечения или после ортогонального вращения (такого как варимакс) - когда факторы / компоненты остаются некоррелированными - нагрузки также являются коэффициентами корреляции. Это свойство линейного уравнения регрессии: с ортогональными стандартизированными предикторами параметры равны корреляциям Пирсона. Таким образом, в таком случае загрузка не может быть выше [-1, 1].
Но если анализировать были только центрированные переменные, то есть анализ был основан на ковариационной матрице, то нагрузки не должны ограничиваться [-1, 1], потому что коэффициенты регрессии в такой модели не обязательно должны быть равны коэффициентам корреляции. На самом деле это ковариации. Обратите внимание, что это были необработанные загрузки. Существуют «масштабированные» или «стандартизированные» загрузки (описанные в ссылках, которые я дал в 1-м абзаце), которые масштабируются, чтобы не покидать полосу [-1, 1].
Причина 2: наклонное вращение. После наклонного вращения, такого как promax или oblimin, у нас есть два типа нагрузок: матричная структура (коэффициенты регрессии или нагрузки как таковые) и структурная матрица (коэффициенты корреляции). Они не равны друг другу по причине, приведенной выше: коэффициенты регрессии коррелированных предикторов отличаются от корреляций Пирсона. Таким образом, загрузка шаблона может легко лежать за пределами [-1, 1]. Обратите внимание, что это верно даже тогда, когда матрица корреляции была анализируемой матрицей. Так вот, когда факторы / компоненты косые.
Причина 3 (редко): дело Хейвуда. Случай Хейвуда ( pt 6 ) представляет собой сложность в алгоритмах факторного анализа, когда на итерациях загрузка превышает теоретически допустимую величину - это происходит, когда общность выходит за пределы дисперсии. Случай Хейвуда - редкая ситуация, которая встречается в некоторых наборах данных, как правило, когда слишком мало переменных для поддержки запрошенного числа факторов. Программы сообщают, что существует ошибка в случае Heywood, и либо останавливаются, либо пытаются ее устранить.