Я ищу совет о том, как анализировать сложные данные опросов с помощью многоуровневых моделей в R. Я использовал этот survey
пакет для взвешивания неравных вероятностей выбора в одноуровневых моделях, но этот пакет не имеет функций для многоуровневого моделирования. lme4
Пакет отлично подходит для многоуровневого моделирования, но это не так , что я знаю , чтобы включать веса на различных уровнях кластеризации. Аспарухов (2006) ставит задачу:
Многоуровневые модели часто используются для анализа данных из схем кластерной выборки. Такие схемы выборки, однако, часто используют неравную вероятность выбора на уровне кластера и на индивидуальном уровне. Веса выборки назначаются на одном или обоих уровнях для отражения этих вероятностей. Если веса выборки игнорируются на любом уровне, оценки параметров могут быть существенно смещены.
Одним из подходов для двухуровневых моделей является многоуровневая оценка псевдо максимального правдоподобия (MPML), которая реализована в MPLUS ( Asparouhov et al,? ). Карл (2009) рассматривает основные пакеты программного обеспечения и дает несколько рекомендаций о том, как действовать:
Чтобы правильно выполнять MLM со сложными данными опроса и расчетными весами, аналитикам необходимо программное обеспечение, которое может включать веса, масштабированные вне программы, и включать «новые» масштабированные веса без автоматического изменения программы. В настоящее время три из основных программ MLM позволяют это: Mplus (5.2), MLwiN (2.02) и GLLAMM. К сожалению, ни HLM, ни SAS не могут этого сделать.
Уэст и Галецки (2013) дают более обновленный обзор, и я процитирую соответствующий отрывок:
Иногда аналитики хотят приспособить LMM к наборам данных обследования, собранным из выборок со сложным дизайном (см. Heeringa et al, 2010, глава 12). Сложные схемы выборки, как правило, характеризуются разделением населения на слои, многоступенчатым отбором групп индивидуумов из слоев и неравными вероятностями отбора как для кластеров, так и для конечных выборочных особей. Эти неравные вероятности отбора обычно приводят к построению весов выборки для отдельных лиц, которые обеспечивают объективную оценку описательных параметров при включении в анализ. Эти весовые коэффициенты могут быть дополнительно скорректированы для отсутствия ответов на опрос и откалиброваны для известных итоговых показателей совокупности. Традиционно, аналитики могут рассмотреть конструктивный подход к включению этих сложных функций выборки при оценке регрессионных моделей (Heeringa et al., 2010). Совсем недавно статистики начали изучать основанные на модели подходы к анализу этих данных, используя LMM для включения фиксированных эффектов страт выборки и случайных эффектов кластеров выборки.
Основная трудность при разработке основанных на моделях подходов к анализу этих данных заключалась в выборе подходящих методов для включения весов выборки (краткую информацию о проблемах см. В Gelman, 2007). Пфефферманн и соавт. (1998), Asparouhov и Muthen (2006), а также Rabe-Hesketh и Skrondal (2006) разработали теорию для оценки многоуровневых моделей таким образом, который включает веса обследования, и Rabe-Hesketh and Skrondal (2006), Carle (2009) и Heeringa et al. (2010, Глава 12) представили приложения, использующие текущие процедуры программного обеспечения, но это продолжает оставаться активной областью статистических исследований. Программные процедуры, способные приспособить LMM, находятся на различных этапах реализации подходов, которые были предложены в литературе до настоящего времени для включения сложных конструктивных особенностей, и аналитики должны учитывать это при подборе LMM к сложным выборочным данным обследования. Аналитики, заинтересованные в подборе LMM к данным, собранным в ходе комплексных выборочных обследований, будут привлекаться к процедурам, способным правильно включать веса обследований в процедуры оценки (HLM, MLwiN, Mplus, xtmixed и gllamm), что согласуется с настоящей литературой в этом разделе. площадь.
Это подводит меня к моему вопросу: есть ли у кого-нибудь рекомендации по наилучшей практике для подгонки LMM к сложным данным обследования в R?
lmer
Функция в lme4
пакете позволяет спецификацию weights
аргумента для процесса модели облегающих, так что если вы исправили конструкцию весы, вы должны быть в состоянии включить их с этим аргументом. У меня здесь не тот конец палки? Есть ли какая-то причина, по которой это не соответствует вашим потребностям?
i've never said it before
с этого поста о addhealth, могут быть интересны .. :(