В отличие от анализа основных компонентов, решения для моделей факторного анализа не обязательно являются вложенными. То есть нагрузки (например) для первого фактора не обязательно будут идентичными, когда извлекается только первый фактор, по сравнению с первыми двумя факторами.
Имея это в виду, рассмотрим случай, когда у вас есть набор переменных манифеста, которые сильно коррелированы и (благодаря теоретическому знанию их содержания) должны управляться одним фактором. Представьте, что анализ поисковых факторов (по метрике, которую вы предпочитаете: параллельный анализ, график осыпей, собственные значения> 1 и т. Д.) Настоятельно предполагает, что есть фактора: большой первичный фактор и небольшой вторичный фактор. Вы заинтересованы в использовании переменных манифеста и факторного решения для оценки (то есть получения значений факторов) значений участников для первого фактора. В этом случае было бы лучше:
- Подберите фактор-модель, чтобы извлечь только фактор и получить оценки факторов (и т. Д.), Или
- Подберите факторную модель, чтобы извлечь оба фактора, получить оценки факторов для факторов, но отбросить / игнорировать оценки для второго фактора?
Почему лучше ? Почему? Есть ли какие-либо исследования по этому вопросу?
Is is always better to extract more factors when they exist?
не очень понятно. Всегда лучше извлечь столько, сколько существует. Недооценка или переоснащение обоих искажают «истинную» скрытую структуру из-за многомерного и не вложенного характера упомянутого вами анализа. Проблема в том, что мы не знаем точно, сколько факторов содержится в наших данных. И есть ли у этих данных столько же, сколько у населения.