Я обеспокоен проблемой, состоящей в том, что я хотел бы запустить p-значение для оценки из данных с множественным вменением (MI), но мне неясно, как объединить p-значения в наборах MI.
Для наборов данных MI стандартный подход для получения полной дисперсии оценок использует правила Рубина. Смотрите здесь для обзора объединения наборов данных MI. Квадратный корень общей дисперсии служит стандартной оценкой ошибки . Однако для некоторых оценщиков полная дисперсия не имеет известной замкнутой формы или распределение выборки не является нормальным. Статистика {\ theta} / {se (\ theta)} может тогда не быть t-распределенной, даже асимптотически.
Поэтому в случае полных данных одним из альтернативных вариантов является начальная загрузка статистики, чтобы найти дисперсию, p-значение и доверительный интервал, даже если распределение выборки не является нормальным и его закрытая форма неизвестна. В случае MI есть два варианта:
- Объединить загруженную дисперсию между наборами данных MI
- Объедините p-значение или доверительные границы между наборами данных MI
Первый вариант затем снова использовал бы правила Рубина. Однако я считаю, что это проблематично, если имеет ненормальное распределение выборки. В этой ситуации (или, в более общем случае, во всех ситуациях) загрузочное p-значение может использоваться напрямую. Однако в случае MI это приведет к множественным значениям p или доверительным интервалам, которые необходимо объединить в наборы данных MI.
Итак, мой вопрос: как мне объединить несколько загруженных p-значений (или доверительных интервалов) в несколько вмененных наборов данных?
Буду рад любым предложениям о том, как поступить, спасибо.