Есть ли название для этого типа начальной загрузки?


9

Рассмотрим эксперимент с несколькими участниками, каждый из которых измерен несколько раз в двух условиях. Модель смешанных эффектов может быть сформулирована (используя синтаксис lme4 ) как:

fit = lmer(
    formula = measure ~ (1|participant) + condition
)

Теперь, скажем, я хочу создать доверительные интервалы для предсказаний этой модели. Я думаю, что я придумал простой и эффективный в вычислительном отношении метод, и я уверен, что я не первый, кто задумывается об этом, но у меня возникают проблемы с поиском любых предыдущих публикаций, описывающих этот подход. Вот:

  1. Установите модель (как указано выше), назовите ее «оригинальная модель»
  2. Получите прогнозы из исходной модели, назовите их «оригинальные прогнозы»
  3. Получить остатки из исходной модели, связанной с каждым ответом от каждого участника
  4. Повторная выборка остатков, выборка участников с заменой
  5. Подгоните линейную модель смешанных эффектов с гауссовой ошибкой к остаткам , назовите это «промежуточной моделью»
  6. Вычислить прогнозы из промежуточной модели для каждого условия (эти прогнозы будут очень близки к нулю), назовите их «промежуточные прогнозы»
  7. Добавьте промежуточные прогнозы к исходным прогнозам, назовите результат «повторные выборки»
  8. Повторите шаги с 4 по 7 много раз, создавая распределение повторных прогнозов для каждого условия, из которого один раз можно вычислить CI.

Я видел процедуры «остаточной начальной загрузки» в контексте простой регрессии (т. Е. Не смешанной модели), где остатки отбираются как единица повторной выборки, а затем добавляются к прогнозам исходной модели, прежде чем подгонять новую модель на каждой итерации бутстрап, но это, кажется, несколько отличается от подхода, который я описываю, где остатки никогда не пересматриваются, люди и только послепромежуточная модель получается, когда в игру вступают предсказания исходной модели. Эта последняя особенность имеет действительно хороший побочный эффект в том, что независимо от сложности исходной модели, промежуточная модель всегда может быть использована в качестве гауссовой линейной смешанной модели, которая в некоторых случаях может быть значительно быстрее. Например, недавно у меня были биномиальные данные и 3 предикторные переменные, одна из которых, как я подозревал, вызывала сильно нелинейные эффекты, поэтому мне пришлось использовать обобщенное аддитивное смешанное моделирование с использованием функции биномиальной связи. Подгонка исходной модели в этом случае заняла более часа, тогда как подгонка гауссова LMM на каждой итерации заняла всего несколько секунд.

Я действительно не хочу претендовать на приоритет, если это уже известная процедура, поэтому я был бы очень признателен, если бы кто-нибудь смог предоставить информацию о том, где это могло быть описано ранее. (Также, если есть какие-то явные проблемы с этим подходом, дайте мне знать!)


1
Просто побочный комментарий, но это может быть актуально. У Питера МакКаллага есть статья в Бернулли, где он показывает, что никакой бутстрап правильно оценивает дисперсию в модели случайных эффектов.
кардинал

@Mike (+1) Это один очень хорошо написанный вопрос!
ЧЛ

1
Почему бы вам не пересчитать участников с заменой, а затем пересчитать их данные? Похоже, это больше соответствует духу многоуровневой модели с одним распределением, вложенным в другой. Другой момент заключается в том, что существует потенциальная проблема с биномиальными данными, потому что крайние концы выборок будут с меньшей вероятностью сходиться.
Джон

@John: Я предпочитаю повторную выборку остатков, потому что (1) это быстрее, когда исходная модель трудоемка для оценки, и (2) она дает CI, которые удалили изменчивость, относящуюся к изменчивости между участниками. # 2 означает, что вам не нужно создавать несколько графиков, когда вы хотите показать необработанные данные и эффект повторных измерений; Вы можете просто нанести эти КИ между удаленными дисперсиями на необработанные данные, и они подойдут для сравнения условий, повторяемых у отдельных людей. Конечно, может возникнуть путаница в значении таких КИ, но для этого нужны подписи к рисункам.
Майк Лоуренс

@John: Не могли бы вы рассказать о своих опасениях относительно применимости этого подхода к биномиальным данным?
Майк Лоуренс

Ответы:


-1

Моя книга Bootstrap Methods 2nd Edition содержит обширную библиографию до 2007 года. Поэтому, даже если я не расскажу об этом предмете в книге, ссылка может быть в библиографии. Конечно, поиск в Google с правильными ключевыми словами может быть лучше. Фридман, Питерс и Навиди сделали начальную загрузку для прогнозирования в линейной регрессии и эконометрических моделях, но я не уверен, что было сделано в случае смешанной модели. Выступление Stine в 1985 году с JASA-бумагой Bootstrap предсказывает регрессию - это то, что вы найдете очень интересным, если вы еще этого не видели.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.