Исследовательский факторный анализ (ОДВ) является подходящим (психометрически и иным образом) для изучения степени, в которой можно объяснить корреляции между несколькими элементами, исходя из общего влияния (не) неизмеренного (т. Е. Скрытого) фактора (ов). Если это не ваше конкретное намерение, рассмотрите альтернативные анализы, например:
- Общее линейное моделирование (например, множественная регрессия, каноническая корреляция или (M) AN (C) OVA)
- Подтверждающий факторный анализ (CFA) или анализ скрытых признаков / классов / профилей
- Структурное уравнение (SEM) / частичное моделирование наименьших квадратов
Размерность - это первая проблема, которую может решить ОДВ. Вы можете исследовать собственные значения ковариационной матрицы (например, создавая осыпной график через EFA) и провести параллельный анализ для определения размерности ваших мер. (См. Также несколько полезных советов и альтернативных предложений от William Revelle .) Вы должны делать это осторожно, прежде чем извлекать ограниченное число факторов и поворачивать их в EFA, или перед тем, как подбирать модель с определенным количеством скрытых факторов, используя CFA, SEM или как. Если параллельный анализ указывает на многомерность, но ваш общий (первый) фактор значительно перевешивает все остальные (т. Е. Имеет наибольшее собственное значение / объясняет большинство отклонений в ваших показателях), рассмотрите бифакторный анализ (Gibbons & Hedeker, 1992;Reise, Moore, & Haviland, 2010 ) .
Многие проблемы возникают в ОДВ и скрытом факторе моделирования рейтингов по шкале Лайкерта. Шкалы Лайкерта дают порядковые (то есть категориальные, политомные, упорядоченные) данные, а не непрерывные данные. Факторный анализ, как правило, предполагает, что любые исходные данные являются непрерывными, и люди часто проводят факторный анализ матриц соотношений продукта и момента Пирсона, которые подходят только для непрерывных данных. Вот цитата из Reise и коллег (2010) :
Обычные подтверждающие факторы аналитические методы не применяются к дихотомическим или политомным данным (Byrne, 2006) . Вместо этого требуются специальные процедуры оценки (Wirth & Edwards, 2007) . В основном существует три варианта работы с данными ответа политомного элемента. Первый заключается в том, чтобы вычислить полихорическую матрицу, а затем применить стандартные методы факторного анализа (см. Knol & Berger, 1991) . Второй вариант заключается в использовании факторного анализа элементов полной информации (Gibbons & Hedeker, 1992) . Третий заключается в использовании процедур оценки ограниченной информации, разработанных специально для упорядоченных данных, таких как взвешенные наименьшие квадраты со средним значением и корректировкой дисперсии (MPLUS; Muthén & Muthén, 2009) .
Я бы порекомендовал объединить как первый, так и третий подходы (т. Е. Использовать диагонально взвешенную оценку наименьших квадратов на полихорической корреляционной матрице) на основе обсуждения проблем Ванга и Каннингема (2005) с типичными альтернативами:
Когда был проведен подтверждающий факторный анализ с использованием ненормальных порядковых данных с использованием максимальной вероятности и на основе корреляций Пирсона и момента произведения, оценки параметров, полученные в этом исследовании, были согласованы с результатами Олссона (1979) . Другими словами, величина ненормальности в наблюдаемых порядковых переменных является основным фактором, определяющим точность оценок параметров.
Результаты также подтверждают выводы Babakus, et al. (1987) . Когда оценка максимального правдоподобия используется с входной матрицей полихорической корреляции в подтверждающих факторных анализах, решения имеют тенденцию приводить к неприемлемым и, следовательно, значительным значениям хи-квадрат вместе с плохой статистикой соответствия.
Остается вопрос, должны ли исследователи использовать взвешенные наименьшие квадраты или диагонально взвешенные наименьшие квадраты при оценке моделей структурных уравнений с ненормальными категориальными данными. Ни взвешенные наименьшие квадраты, ни оценка наименьших квадратов по диагонали не делают предположений о характере распределения переменных, и оба метода дают асимптотически достоверные результаты. Тем не менее, поскольку взвешенная оценка наименьших квадратов основана на моментах четвертого порядка, этот подход часто приводит к практическим проблемам и требует больших вычислительных ресурсов. Это означает, что взвешенная оценка наименьших квадратов может быть недостаточно устойчивой при использовании для оценки моделей со средним значением, т. Е. С 10 показателями для больших размеров и малых и средних размеров выборки.
Мне не ясно, относится ли та же проблема с оценкой взвешенных наименьших квадратов к оценке DWLS; независимо от того, авторы рекомендуют оценку. Если у вас уже нет средств:
- R (R Core Team, 2012) бесплатно. Вам понадобится старая версия (например,
2.15.2
) для этих пакетов:
psych
Пакет (Ревеллы, 2013) содержит polychoric
функцию.
fa.parallel
Функция может помочь определить ряд факторов для извлечения.
lavaan
Пакет (Rosseel, 2012) предлагает DWLS оценки для анализа скрытого переменного.
semTools
Пакет содержит efaUnrotate
, orthRotate
и oblqRotate
функции.
- В
mirt
пакете (Chalmers, 2012) предлагает перспективные альтернативы , используя теорию ответа пункта.
Я полагаю, что Mplus (Muthén & Muthén, 1998-2011) также будет работать, но бесплатная демо-версия не будет содержать более шести измерений, а лицензионная версия не дешевая. Это может стоить того, если вы можете себе это позволить; люди любят Mplus , и обслуживание клиентов Muthéns через их форумы невероятно!
Как указывалось выше, оценка DWLS преодолевает проблему нарушений допущений нормальности (как одномерных, так и многомерных), которая является очень распространенной и почти повсеместной в данных рейтинга по шкале Лайкерта. Однако это не обязательно прагматически вытекающая проблема; большинство методов не слишком чувствительны (сильно предвзяты) к мелким нарушениям (ср. Тестирование нормальности «по сути бесполезно»? ). Ответ @ chl на этот вопрос поднимает более важные, отличные вопросы и предложения относительно проблем с экстремальным стилем ответа; определенно проблема с оценками по шкале Лайкерта и другими субъективными данными.
Список литературы
· Бабакус, Э., Фергюсон, JCE, & Jöreskog, KG (1987). Чувствительность подтверждающего анализа факторов максимального правдоподобия к нарушениям шкалы измерений и допущений распределения. Журнал маркетинговых исследований, 24 , 222–228.
· Бирн, Б.М. (2006). Моделирование структурных уравнений с помощью EQS. Махва, Нью-Джерси: Лоуренс Эрлбаум.
· Чалмерс, RP (2012). mirt: пакет многоплановой теории отклика предмета для среды R. Журнал статистического программного обеспечения, 48 (6), 1–29. Получено с http://www.jstatsoft.org/v48/i06/ .
· Gibbons, RD & Hedeker, DR (1992). Полный информационный элемент двухфакторного анализа.
Психометрика, 57 , 423–436.
· Knol, DL & Berger, MPF (1991). Эмпирическое сравнение между факторным анализом и многомерными моделями ответа. Многомерное поведенческое исследование, 26 , 457–477.
· Muthén, LK, & Muthén, BO (1998-2011). Руководство пользователя Mplus (6-е изд.). Лос-Анджелес, Калифорния: Мутен и Мутен.
· Muthén, LK, & Muthén, BO (2009). Mplus (версия 4.00). [Компьютерное программное обеспечение]. Лос-Анджелес, Калифорния: Автор. URL: http://www.statmodel.com .
· Олссон, У. (1979). Оценки максимального правдоподобия для коэффициента полихорической корреляции. Психометрика, 44 , 443–460.
·R Core Team. (2012). Р: Язык и среда для статистических вычислений. R Фонд статистических вычислений, Вена, Австрия. ISBN 3-900051-07-0, URL: http://www.R-project.org/ .
· Reise, SP, Moore, TM & Haviland, MG (2010). Бифакторные модели и ротации: изучение степени, в которой многомерные данные дают однозначные оценки по шкале. Журнал оценки личности, 92 (6), 544–559. Получено с http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2981404/ .
· Revelle, W. (2013). Психология: Процедуры для личностных и психологических исследований. Северо-западный университет, Эванстон, Иллинойс, США. Получено с http://CRAN.R-project.org/package=psych . Версия = 1.3.2.
· Россель Ю. (2012). lavaan: пакет R для моделирования структурных уравнений. Журнал статистического программного обеспечения, 48 (2), 1–36. Получено с http://www.jstatsoft.org/v48/i02/ .
· Wang, WC, & Cunningham, EG (2005). Сравнение альтернативных методов оценки в подтверждающих факторных анализах Общего вопросника здоровья. Психологические отчеты, 97 , 3–10.
· Wirth, RJ & Edwards, MC (2007). Предметный анализ: современные подходы и будущие направления. Психологические методы, 12 , 58–79. Получено с http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3162326/ .