Об использовании наклонного вращения после PCA


9

Несколько статистических пакетов, таких как SAS, SPSS и R, позволяют выполнять некую ротацию факторов после PCA.

  1. Почему ротация необходима после PCA?
  2. Зачем вам применять наклонное вращение после PCA, учитывая, что целью PCA является получение ортогональных размеров?

Я задал вопрос, который иллюстрирует необходимость ротации факторов после PCA, поскольку PCA дает необъективный результат. См stats.stackexchange.com/questions/6575/...
mbaitoff

Ответы:


8

Я думаю, что существуют разные мнения или взгляды на PCA, но в основном мы часто думаем об этом как о методе сокращения (вы уменьшаете пространство функций до меньшего, часто гораздо более «читабельного», если вы позаботитесь о правильном центрировании / стандартизации данные, когда это необходимо) или способ построения скрытых факторовили измерения, которые составляют значительную часть межиндивидуальной дисперсии (здесь «индивидуумы» обозначают статистические единицы, по которым собираются данные; это могут быть страна, люди и т. д.). В обоих случаях мы строим линейные комбинации исходных переменных, которые учитывают максимум дисперсии (при проецировании на главную ось), с учетом ограничения ортогональности между любыми двумя основными компонентами. Теперь то, что было описано, является чисто алгебраическим или математическим, и мы не думаем об этом как о (порождающей) модели, в отличие от того, что делается в традиции факторного анализа, где мы включаем термин ошибки, чтобы учесть некоторую ошибку измерения , Мне также нравится введение, данное Уильямом Ревеллом в его следующем руководстве по прикладной психометрии с использованием R (Глава 6), если мы хотим проанализировать структуру корреляционной матрицы, то

Первый [подход, PCA] представляет собой модель, которая аппроксимирует матрицу корреляции в терминах произведения компонентов, где каждый компонент представляет собой взвешенную линейную сумму переменных, вторая модель [факторный анализ] также является приближением матрицы корреляции продукт двух факторов, но факторы в этом рассматриваются как причины, а не как следствия переменных.

Другими словами, с PCA вы выражаете каждый компонент (фактор) как линейную комбинацию переменных, тогда как в FA это переменные, которые выражаются как линейная комбинация факторов. Хорошо известно, что оба метода, как правило, дают довольно схожие результаты (см., Например, Harman, 1976 или Catell, 1978), особенно в «идеальном» случае, когда у нас большое количество индивидуумов и хороший коэффициент отношения: переменные (обычно меняющиеся от 2 до 10 в зависимости от авторов, которых вы считаете!). Это происходит потому, что путем оценки диагоналей в матрице корреляции (как это делается в FA, и эти элементы известны как сообщества), дисперсия ошибки исключается из матрицы факторов. Это причина, почему PCA часто используется как способ выявления скрытых факторов или психологических конструкций вместо ФА, разработанных в прошлом веке. Но, продолжая идти по этому пути, мы часто хотим достичь более простой интерпретации результирующей факторной структуры (или так называемой матрицы шаблонов). И затем приходит полезный трюк вращения оси факториала, чтобы мы максимизировали нагрузки переменных на конкретный фактор или, что эквивалентно, достигли «простой структуры». Используя ортогональное вращение (например, VARIMAX), мы сохраняем независимость факторов. При наклонном вращении (например, OBLIMIN, PROMAX) мы нарушаем его, и факторы могут коррелировать. Это в значительной степени обсуждалось в литературе и привело некоторых авторов (не психометристов, а статистиков в начале 1960-х годов).

Но дело в том, что методы ротации были изначально разработаны в контексте подхода ФА и теперь регулярно используются с PCA. Я не думаю, что это противоречит алгоритмическому вычислению главных компонентов: вы можете вращать свои факториальные оси так, как вам хочется, при условии, что вы помните, что после корреляции (наклонным вращением) интерпретация факториального пространства становится менее очевидной.

PCA обычно используется при разработке новых вопросников, хотя ФА, вероятно, является лучшим подходом в этом случае, потому что мы пытаемся извлечь значимые факторы, которые учитывают ошибки измерений и чьи отношения могут быть изучены сами по себе (например, путем выделения полученной модели матрица, мы получаем фактор-модель второго порядка). Но PCA также используется для проверки факториальной структуры уже проверенных. Исследователи на самом деле не имеют значения относительно FA против PCA, когда у них есть, например, 500 репрезентативных субъектов, которых просят оценить вопросник из 60 пунктов, охватывающий пять измерений (это случай NEO-FFIнапример), и я думаю, что они правы, потому что в этом случае мы не очень заинтересованы в идентификации генерирующей или концептуальной модели (термин «представитель» используется здесь для смягчения проблемы неизменности измерений ).

Теперь о выборе метода вращения и о том, почему некоторые авторы выступают против строгого использования ортогонального вращения, я хотел бы процитировать Пола Клайна, как я сделал в ответ на следующий вопрос, FA: Выбор матрицы вращения, основанной на «Простая структура Критерии » ,

(...) в реальном мире не исключено, что факторы как важные детерминанты поведения будут коррелированы. - П. Клайн, разведка. Психометрический взгляд , 1991, с. 19

Таким образом, я бы пришел к выводу, что в зависимости от цели вашего исследования (хотите ли вы выделить основные закономерности вашей матрицы корреляции или вы пытаетесь дать разумную интерпретацию базовых механизмов, которые могли бы заставить вас наблюдать такую ​​матрицу корреляции ) вы должны выбрать наиболее подходящий метод: это не связано с построением линейных комбинаций, а просто с тем, как вы хотите интерпретировать получающееся факториальное пространство.

Ссылки

  1. Harman, HH (1976). Современный факторный анализ . Чикаго, Университет Чикагской Прессы.
  2. Cattell, RB (1978). Научное использование факторного анализа . Нью-Йорк, Пленум.
  3. Клайн П. (1991). Intelligence. Психометрический взгляд . Рутледж.

4

Проблема с ортогональными размерами состоит в том, что компоненты могут быть не интерпретируемыми. Таким образом, в то время как наклонное вращение (т.е. неортогональные размеры) технически менее удовлетворительно, такое вращение иногда улучшает интерпретируемость результирующих компонентов.


4

Основные пункты

  • Вращение может сделать интерпретацию компонентов более четкой
  • Наклонное вращение часто имеет более теоретический смысл. Т.е. наблюдаемые переменные могут быть объяснены в терминах меньшего числа коррелированных компонентов.

пример

  • 10 тестирует все способности к измерению с некоторым измерением вербального и некоторым измерением пространственной способности. Все тесты взаимосвязаны, но внутри словесных или пространственных тестов взаимосвязей больше, чем между типами тестов. Скупой PCA может включать два взаимосвязанных компонента, словесный и пространственный. Теория и исследования показывают, что эти две способности взаимосвязаны. Таким образом, наклонное вращение имеет теоретический смысл.
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.