Исследовательский факторный анализ (ОДВ) является подходящим (психометрически и иным образом) для изучения степени, в которой можно объяснить корреляции между несколькими элементами, исходя из общего влияния (не) неизмеренного (т. Е. Скрытого) фактора (ов). Если это не ваше конкретное намерение, рассмотрите альтернативные анализы, например:
- Общее линейное моделирование (например, множественная регрессия, каноническая корреляция или (M) AN (C) OVA)
- Подтверждающий факторный анализ (CFA) или анализ скрытых признаков / классов / профилей
- Структурное уравнение (SEM) / частичное моделирование наименьших квадратов
Размерность - это первая проблема, которую может решить ОДВ. Вы можете исследовать собственные значения ковариационной матрицы (например, создавая осыпной график через EFA) и провести параллельный анализ для определения размерности ваших мер. (См. Также несколько полезных советов и альтернативных предложений от William Revelle .) Вы должны делать это осторожно, прежде чем извлекать ограниченное число факторов и поворачивать их в EFA, или перед тем, как подбирать модель с определенным количеством скрытых факторов, используя CFA, SEM или как. Если параллельный анализ указывает на многомерность, но ваш общий (первый) фактор значительно перевешивает все остальные (т. Е. Имеет наибольшее собственное значение / объясняет большинство отклонений в ваших показателях), рассмотрите бифакторный анализ (Gibbons & Hedeker, 1992;Reise, Moore, & Haviland, 2010 ) .
Многие проблемы возникают в ОДВ и скрытом факторе моделирования рейтингов по шкале Лайкерта. Шкалы Лайкерта дают порядковые (то есть категориальные, политомные, упорядоченные) данные, а не непрерывные данные. Факторный анализ, как правило, предполагает, что любые исходные данные являются непрерывными, и люди часто проводят факторный анализ матриц соотношений продукта и момента Пирсона, которые подходят только для непрерывных данных. Вот цитата из Reise и коллег (2010) :
Обычные подтверждающие факторы аналитические методы не применяются к дихотомическим или политомным данным (Byrne, 2006) . Вместо этого требуются специальные процедуры оценки (Wirth & Edwards, 2007) . В основном существует три варианта работы с данными ответа политомного элемента. Первый заключается в том, чтобы вычислить полихорическую матрицу, а затем применить стандартные методы факторного анализа (см. Knol & Berger, 1991) . Второй вариант заключается в использовании факторного анализа элементов полной информации (Gibbons & Hedeker, 1992) . Третий заключается в использовании процедур оценки ограниченной информации, разработанных специально для упорядоченных данных, таких как взвешенные наименьшие квадраты со средним значением и корректировкой дисперсии (MPLUS; Muthén & Muthén, 2009) .
Я бы порекомендовал объединить как первый, так и третий подходы (т. Е. Использовать диагонально взвешенную оценку наименьших квадратов на полихорической корреляционной матрице) на основе обсуждения проблем Ванга и Каннингема (2005) с типичными альтернативами:
Когда был проведен подтверждающий факторный анализ с использованием ненормальных порядковых данных с использованием максимальной вероятности и на основе корреляций Пирсона и момента произведения, оценки параметров, полученные в этом исследовании, были согласованы с результатами Олссона (1979) . Другими словами, величина ненормальности в наблюдаемых порядковых переменных является основным фактором, определяющим точность оценок параметров.
Результаты также подтверждают выводы Babakus, et al. (1987) . Когда оценка максимального правдоподобия используется с входной матрицей полихорической корреляции в подтверждающих факторных анализах, решения имеют тенденцию приводить к неприемлемым и, следовательно, значительным значениям хи-квадрат вместе с плохой статистикой соответствия.
Остается вопрос, должны ли исследователи использовать взвешенные наименьшие квадраты или диагонально взвешенные наименьшие квадраты при оценке моделей структурных уравнений с ненормальными категориальными данными. Ни взвешенные наименьшие квадраты, ни оценка наименьших квадратов по диагонали не делают предположений о характере распределения переменных, и оба метода дают асимптотически достоверные результаты. Тем не менее, поскольку взвешенная оценка наименьших квадратов основана на моментах четвертого порядка, этот подход часто приводит к практическим проблемам и требует больших вычислительных ресурсов. Это означает, что взвешенная оценка наименьших квадратов может быть недостаточно устойчивой при использовании для оценки моделей со средним значением, т. Е. С 10 показателями для больших размеров и малых и средних размеров выборки.
Мне не ясно, относится ли та же проблема с оценкой взвешенных наименьших квадратов к оценке DWLS; независимо от того, авторы рекомендуют оценку. Если у вас уже нет средств:
- R (R Core Team, 2012) бесплатно. Вам понадобится старая версия (например,
2.15.2) для этих пакетов:
psychПакет (Ревеллы, 2013) содержит polychoricфункцию.
fa.parallelФункция может помочь определить ряд факторов для извлечения.
lavaanПакет (Rosseel, 2012) предлагает DWLS оценки для анализа скрытого переменного.
semToolsПакет содержит efaUnrotate, orthRotateи oblqRotateфункции.
- В
mirtпакете (Chalmers, 2012) предлагает перспективные альтернативы , используя теорию ответа пункта.
Я полагаю, что Mplus (Muthén & Muthén, 1998-2011) также будет работать, но бесплатная демо-версия не будет содержать более шести измерений, а лицензионная версия не дешевая. Это может стоить того, если вы можете себе это позволить; люди любят Mplus , и обслуживание клиентов Muthéns через их форумы невероятно!
Как указывалось выше, оценка DWLS преодолевает проблему нарушений допущений нормальности (как одномерных, так и многомерных), которая является очень распространенной и почти повсеместной в данных рейтинга по шкале Лайкерта. Однако это не обязательно прагматически вытекающая проблема; большинство методов не слишком чувствительны (сильно предвзяты) к мелким нарушениям (ср. Тестирование нормальности «по сути бесполезно»? ). Ответ @ chl на этот вопрос поднимает более важные, отличные вопросы и предложения относительно проблем с экстремальным стилем ответа; определенно проблема с оценками по шкале Лайкерта и другими субъективными данными.
Список литературы
· Бабакус, Э., Фергюсон, JCE, & Jöreskog, KG (1987). Чувствительность подтверждающего анализа факторов максимального правдоподобия к нарушениям шкалы измерений и допущений распределения. Журнал маркетинговых исследований, 24 , 222–228.
· Бирн, Б.М. (2006). Моделирование структурных уравнений с помощью EQS. Махва, Нью-Джерси: Лоуренс Эрлбаум.
· Чалмерс, RP (2012). mirt: пакет многоплановой теории отклика предмета для среды R. Журнал статистического программного обеспечения, 48 (6), 1–29. Получено с http://www.jstatsoft.org/v48/i06/ .
· Gibbons, RD & Hedeker, DR (1992). Полный информационный элемент двухфакторного анализа.
Психометрика, 57 , 423–436.
· Knol, DL & Berger, MPF (1991). Эмпирическое сравнение между факторным анализом и многомерными моделями ответа. Многомерное поведенческое исследование, 26 , 457–477.
· Muthén, LK, & Muthén, BO (1998-2011). Руководство пользователя Mplus (6-е изд.). Лос-Анджелес, Калифорния: Мутен и Мутен.
· Muthén, LK, & Muthén, BO (2009). Mplus (версия 4.00). [Компьютерное программное обеспечение]. Лос-Анджелес, Калифорния: Автор. URL: http://www.statmodel.com .
· Олссон, У. (1979). Оценки максимального правдоподобия для коэффициента полихорической корреляции. Психометрика, 44 , 443–460.
·R Core Team. (2012). Р: Язык и среда для статистических вычислений. R Фонд статистических вычислений, Вена, Австрия. ISBN 3-900051-07-0, URL: http://www.R-project.org/ .
· Reise, SP, Moore, TM & Haviland, MG (2010). Бифакторные модели и ротации: изучение степени, в которой многомерные данные дают однозначные оценки по шкале. Журнал оценки личности, 92 (6), 544–559. Получено с http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2981404/ .
· Revelle, W. (2013). Психология: Процедуры для личностных и психологических исследований. Северо-западный университет, Эванстон, Иллинойс, США. Получено с http://CRAN.R-project.org/package=psych . Версия = 1.3.2.
· Россель Ю. (2012). lavaan: пакет R для моделирования структурных уравнений. Журнал статистического программного обеспечения, 48 (2), 1–36. Получено с http://www.jstatsoft.org/v48/i02/ .
· Wang, WC, & Cunningham, EG (2005). Сравнение альтернативных методов оценки в подтверждающих факторных анализах Общего вопросника здоровья. Психологические отчеты, 97 , 3–10.
· Wirth, RJ & Edwards, MC (2007). Предметный анализ: современные подходы и будущие направления. Психологические методы, 12 , 58–79. Получено с http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3162326/ .