Факторный анализ анкет, составленных из элементов Лайкерта


17

Раньше я анализировал предметы с психометрической точки зрения. Но сейчас я пытаюсь проанализировать другие типы вопросов по мотивации и другим темам. Эти вопросы все по шкалам Лайкерта. Моя первоначальная мысль состояла в том, чтобы использовать факторный анализ, потому что гипотезы предполагают отражение некоторых основных аспектов.

  • Но уместен ли факторный анализ?
  • Нужно ли проверять каждый вопрос относительно его размерности?
  • Есть ли проблема с выполнением факторного анализа на предметах likert?
  • Есть ли хорошие статьи и методы о том, как проводить факторный анализ по Лайкерту и другим категориям?

Если я правильно понимаю, ваш вопрос охватывает, по крайней мере, две разные темы: (1) использование ФА в отношении или шкале мотивации и (2) как справиться с «экстремальными» моделями ответов (эффект потолка / минимума) в таких шкалах?
ЧЛ

Ответы:


22

Из того, что я видел до сих пор, FA используется для позиций, как и для других видов оценочных шкал. Проблема, возникающая из-за используемой метрики (то есть «действительно ли шкалы Лайкерта должны рассматриваться как числовые шкалы?» - давняя дискуссия, но, предоставляя вам проверку распределения колоколообразных откликов, вы можете обращаться с ними как с непрерывными измерениями, в противном случае проверка на нелинейные модели FA или оптимальное масштабирование ) может быть обработана политомными моделями IRT, такими как градуированный отклик, рейтинговая шкала или модель частичного кредита. Последние два могут использоваться как грубая проверка того, являются ли пороговые расстояния, используемые в элементах типа Лайкерта, характеристикой формата ответа (RSM) или конкретного элемента (PCM).

Что касается вашего второго пункта, то, например, известно, что распределение ответов в опросах об отношении к здоровью или в отношении здоровья отличается от страны к стране (например, китайцы, как правило, выделяют «экстремальные» схемы реагирования по сравнению с людьми из западных стран, см., Например, Song , X.-Y. (2007) Анализ моделей мультиструктурных структурных уравнений с приложениями к данным о качестве жизни, в Справочнике по скрытой переменной и родственным моделям , Lee, S.-Y. (Ed.), Стр. 279-302, Север -Holland). Некоторые методы, чтобы справиться с такой ситуацией с моей головы:

  • использование лог-линейных моделей (маржинальный подход) для выделения сильного дисбаланса между группами на уровне позиции (коэффициенты затем интерпретируются как относительные риски, а не шансы);
  • мультисэмпловый метод SEM из Song, упомянутый выше (хотя я не знаю, будут ли они продолжать работать над этим подходом).

Дело в том, что большинство из этих подходов фокусируются на уровне предметов (эффект потолка / пола, сниженная надежность, статистика плохого соответствия предметов и т. Д.), Но когда кто-то интересуется тем, как люди отклоняются от того, что можно ожидать от идеала группа наблюдателей / респондентов, я думаю, что вместо этого мы должны сосредоточиться на показателях соответствия человека.

Таких χ2 статистические данные легко доступны для моделей IRT, как INFIT или обмундирования средней площади, но , как правило , они применяются на всей анкете. Кроме того, поскольку оценка параметров элементов частично зависит от параметров лиц (например, в рамках предельного правдоподобия, мы предполагаем гауссовское распределение), присутствие удаленных лиц может привести к потенциально необъективным оценкам и плохому соответствию модели.

Как предложено Eid и Zickar (2007), объединение модели скрытого класса (для изоляции группы респондентов, например, тех, кто всегда отвечает на экстремальные категории по сравнению с другими) и модели IRT (для оценки параметров элемента и местоположения людей на скрытой черта в обеих группах) представляется хорошим решением. Другие стратегии моделирования описаны в их статье (например, модель HYBRID, см. Также Holden and Book, 2009).

Аналогичным образом, разворачивающиеся модели могут использоваться для соответствия стилю ответа , который определяется как согласованный и независимый от содержимого шаблон категории ответа (например, тенденция соглашаться со всеми утверждениями). В общественных науках или психологической литературе это называется экстремальным стилем ответа (ERS). Ссылки (1–3) могут быть полезны, чтобы получить представление о том, как оно проявляется и как его можно измерить.

Вот краткий список статей, которые могут помочь в продвижении по этому вопросу:

  1. Гамильтон, США (1968). Атрибуты личности связаны с экстремальным стилем ответа . Психологический вестник , 69 (3) : 192–203.
  2. Greanleaf, EA (1992). Измерение экстремального стиля ответа. Общественное мнение Quaterly , 56 (3) : 328-351.
  3. de Jong, MG, Steenkamp, ​​J.-BEM, Fox, J.-P. и Baumgartner, H. (2008). Использование теории отклика предмета для измерения экстремального стиля отклика в маркетинговых исследованиях: глобальное расследование. Журнал маркетинговых исследований , 45 (1) : 104-115.
  4. Morren, M., Gelissen, J. и Vermunt, JK (2009). Работа с экстремальным стилем ответа в межкультурном исследовании: ограниченный подход к анализу латентного фактора
  5. Мавров, Г. (2003). Диагностика поведения стиля ответа с помощью факторного подхода латентного класса. Пересмотрены социально-демографические корреляции гендерных ролей и представлений о этнической дискриминации. Качество и количество , 37 (3), 277-302.
  6. де Йонг, М. Г. Стинкамп, JB, Fox, J.-P. и Baumgartner, H. (2008). Теория отклика предмета для измерения экстремального стиля отклика в маркетинговых исследованиях: глобальное расследование. Журнал маркетинговых исследований , 45 (1), 104-115.
  7. Хаварас К.Н. и Рипли Б.Д. (2007). «Развертывающаяся» модель скрытой переменной для данных об отношении Лайкерта. JASA , 102 (478): 454-463.
  8. слайды от Мустаки, Кнотта и Мавридиса, Методы обнаружения выбросов в моделях скрытых переменных
  9. Эйд М. и Зикар М.Дж. (2007). Обнаружение стилей ответа и подделки в личностных и организационных оценках по смешанным моделям Раша. In von Davier, M. and Carstensen, CH (Eds.), Модели Rasch с многомерным распределением и распределением смеси. смешанные , с. 255–270, Springer.
  10. Holden RR and Book, AS (2009). Использование гибридного моделирования класса Rasch-latent для улучшения обнаружения мошенников в личном инвентаре. Индивидуальные и индивидуальные различия , 47 (3) : 185-190.

Неработающие ссылки для Гамильтона (1968) и Моррена, Гелиссена и Вермунта (2009) ... облом! Не удалось найти альтернативные источники в Google Scholar (хотя пока не пробовал обычный старый Google).
Ник Стаунер

13

Исследовательский факторный анализ (ОДВ) является подходящим (психометрически и иным образом) для изучения степени, в которой можно объяснить корреляции между несколькими элементами, исходя из общего влияния (не) неизмеренного (т. Е. Скрытого) фактора (ов). Если это не ваше конкретное намерение, рассмотрите альтернативные анализы, например:

  • Общее линейное моделирование (например, множественная регрессия, каноническая корреляция или (M) AN (C) OVA)
  • Подтверждающий факторный анализ (CFA) или анализ скрытых признаков / классов / профилей
  • Структурное уравнение (SEM) / частичное моделирование наименьших квадратов

Размерность - это первая проблема, которую может решить ОДВ. Вы можете исследовать собственные значения ковариационной матрицы (например, создавая осыпной график через EFA) и провести параллельный анализ для определения размерности ваших мер. (См. Также несколько полезных советов и альтернативных предложений от William Revelle .) Вы должны делать это осторожно, прежде чем извлекать ограниченное число факторов и поворачивать их в EFA, или перед тем, как подбирать модель с определенным количеством скрытых факторов, используя CFA, SEM или как. Если параллельный анализ указывает на многомерность, но ваш общий (первый) фактор значительно перевешивает все остальные (т. Е. Имеет наибольшее собственное значение / объясняет большинство отклонений в ваших показателях), рассмотрите бифакторный анализ (Gibbons & Hedeker, 1992;Reise, Moore, & Haviland, 2010 ) .

Многие проблемы возникают в ОДВ и скрытом факторе моделирования рейтингов по шкале Лайкерта. Шкалы Лайкерта дают порядковые (то есть категориальные, политомные, упорядоченные) данные, а не непрерывные данные. Факторный анализ, как правило, предполагает, что любые исходные данные являются непрерывными, и люди часто проводят факторный анализ матриц соотношений продукта и момента Пирсона, которые подходят только для непрерывных данных. Вот цитата из Reise и коллег (2010) :

Обычные подтверждающие факторы аналитические методы не применяются к дихотомическим или политомным данным (Byrne, 2006) . Вместо этого требуются специальные процедуры оценки (Wirth & Edwards, 2007) . В основном существует три варианта работы с данными ответа политомного элемента. Первый заключается в том, чтобы вычислить полихорическую матрицу, а затем применить стандартные методы факторного анализа (см. Knol & Berger, 1991) . Второй вариант заключается в использовании факторного анализа элементов полной информации (Gibbons & Hedeker, 1992) . Третий заключается в использовании процедур оценки ограниченной информации, разработанных специально для упорядоченных данных, таких как взвешенные наименьшие квадраты со средним значением и корректировкой дисперсии (MPLUS; Muthén & Muthén, 2009) .

Я бы порекомендовал объединить как первый, так и третий подходы (т. Е. Использовать диагонально взвешенную оценку наименьших квадратов на полихорической корреляционной матрице) на основе обсуждения проблем Ванга и Каннингема (2005) с типичными альтернативами:

Когда был проведен подтверждающий факторный анализ с использованием ненормальных порядковых данных с использованием максимальной вероятности и на основе корреляций Пирсона и момента произведения, оценки параметров, полученные в этом исследовании, были согласованы с результатами Олссона (1979) . Другими словами, величина ненормальности в наблюдаемых порядковых переменных является основным фактором, определяющим точность оценок параметров.

Результаты также подтверждают выводы Babakus, et al. (1987) . Когда оценка максимального правдоподобия используется с входной матрицей полихорической корреляции в подтверждающих факторных анализах, решения имеют тенденцию приводить к неприемлемым и, следовательно, значительным значениям хи-квадрат вместе с плохой статистикой соответствия.

Остается вопрос, должны ли исследователи использовать взвешенные наименьшие квадраты или диагонально взвешенные наименьшие квадраты при оценке моделей структурных уравнений с ненормальными категориальными данными. Ни взвешенные наименьшие квадраты, ни оценка наименьших квадратов по диагонали не делают предположений о характере распределения переменных, и оба метода дают асимптотически достоверные результаты. Тем не менее, поскольку взвешенная оценка наименьших квадратов основана на моментах четвертого порядка, этот подход часто приводит к практическим проблемам и требует больших вычислительных ресурсов. Это означает, что взвешенная оценка наименьших квадратов может быть недостаточно устойчивой при использовании для оценки моделей со средним значением, т. Е. С 10 показателями для больших размеров и малых и средних размеров выборки.

Мне не ясно, относится ли та же проблема с оценкой взвешенных наименьших квадратов к оценке DWLS; независимо от того, авторы рекомендуют оценку. Если у вас уже нет средств:

  • R (R Core Team, 2012) бесплатно. Вам понадобится старая версия (например, 2.15.2) для этих пакетов:
    • psychПакет (Ревеллы, 2013) содержит polychoricфункцию.
      • fa.parallelФункция может помочь определить ряд факторов для извлечения.
    • lavaanПакет (Rosseel, 2012) предлагает DWLS оценки для анализа скрытого переменного.
    • semToolsПакет содержит efaUnrotate, orthRotateи oblqRotateфункции.
    • В mirtпакете (Chalmers, 2012) предлагает перспективные альтернативы , используя теорию ответа пункта.

Я полагаю, что Mplus (Muthén & Muthén, 1998-2011) также будет работать, но бесплатная демо-версия не будет содержать более шести измерений, а лицензионная версия не дешевая. Это может стоить того, если вы можете себе это позволить; люди любят Mplus , и обслуживание клиентов Muthéns через их форумы невероятно!

Как указывалось выше, оценка DWLS преодолевает проблему нарушений допущений нормальности (как одномерных, так и многомерных), которая является очень распространенной и почти повсеместной в данных рейтинга по шкале Лайкерта. Однако это не обязательно прагматически вытекающая проблема; большинство методов не слишком чувствительны (сильно предвзяты) к мелким нарушениям (ср. Тестирование нормальности «по сути бесполезно»? ). Ответ @ chl на этот вопрос поднимает более важные, отличные вопросы и предложения относительно проблем с экстремальным стилем ответа; определенно проблема с оценками по шкале Лайкерта и другими субъективными данными.


Список литературы
· Бабакус, Э., Фергюсон, JCE, & Jöreskog, KG (1987). Чувствительность подтверждающего анализа факторов максимального правдоподобия к нарушениям шкалы измерений и допущений распределения. Журнал маркетинговых исследований, 24 , 222–228.
· Бирн, Б.М. (2006). Моделирование структурных уравнений с помощью EQS. Махва, Нью-Джерси: Лоуренс Эрлбаум.
· Чалмерс, RP (2012). mirt: пакет многоплановой теории отклика предмета для среды R. Журнал статистического программного обеспечения, 48 (6), 1–29. Получено с http://www.jstatsoft.org/v48/i06/ .
· Gibbons, RD & Hedeker, DR (1992). Полный информационный элемент двухфакторного анализа. Психометрика, 57 , 423–436.
· Knol, DL & Berger, MPF (1991). Эмпирическое сравнение между факторным анализом и многомерными моделями ответа. Многомерное поведенческое исследование, 26 , 457–477.
· Muthén, LK, & Muthén, BO (1998-2011). Руководство пользователя Mplus (6-е изд.). Лос-Анджелес, Калифорния: Мутен и Мутен.
· Muthén, LK, & Muthén, BO (2009). Mplus (версия 4.00). [Компьютерное программное обеспечение]. Лос-Анджелес, Калифорния: Автор. URL: http://www.statmodel.com .
· Олссон, У. (1979). Оценки максимального правдоподобия для коэффициента полихорической корреляции. Психометрика, 44 , 443–460.
·R Core Team. (2012). Р: Язык и среда для статистических вычислений. R Фонд статистических вычислений, Вена, Австрия. ISBN 3-900051-07-0, URL: http://www.R-project.org/ .
· Reise, SP, Moore, TM & Haviland, MG (2010). Бифакторные модели и ротации: изучение степени, в которой многомерные данные дают однозначные оценки по шкале. Журнал оценки личности, 92 (6), 544–559. Получено с http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2981404/ .
· Revelle, W. (2013). Психология: Процедуры для личностных и психологических исследований. Северо-западный университет, Эванстон, Иллинойс, США. Получено с http://CRAN.R-project.org/package=psych . Версия = 1.3.2.
· Россель Ю. (2012). lavaan: пакет R для моделирования структурных уравнений. Журнал статистического программного обеспечения, 48 (2), 1–36. Получено с http://www.jstatsoft.org/v48/i02/ .
· Wang, WC, & Cunningham, EG (2005). Сравнение альтернативных методов оценки в подтверждающих факторных анализах Общего вопросника здоровья. Психологические отчеты, 97 , 3–10.
· Wirth, RJ & Edwards, MC (2007). Предметный анализ: современные подходы и будущие направления. Психологические методы, 12 , 58–79. Получено с http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3162326/ .


(+11) Не знаю, как я пропустил твой ответ!
ЧЛ

Ха! Благодарность! Этот сидел там некоторое время. Я предположил, что это было слишком длинным или неясным, или, возможно, полагалось на новые методы, которые были более спорными, чем я думал. Похоже, я еще не знал, как использовать теги для имен пользователей.
Ник Стаунер,

4

Просто короткое замечание о том, что вы можете рассмотреть полихорическую корреляцию с факторным анализом, а не традиционную матрицу корреляции / ковариации.

http://www.john-uebersax.com/stat/sem.htm

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.