Я провел компьютерную оценку различных методов подгонки модели определенного типа, используемой в науках о палео. У меня был большой тренировочный набор, и поэтому я случайно (стратифицированная случайная выборка) отложил тестовый набор. Я подгонял различных методов к выборкам обучающих наборов и, используя результирующих моделей, предсказывал отклик для выборок тестовых наборов и вычислял RMSEP для выборок в тестовом наборе. Это одиночный забег .
Затем я повторял этот процесс большое количество раз, каждый раз выбирая другой набор тренировок путем случайной выборки нового набора тестов.
Сделав это, я хочу выяснить, имеет ли какой-либо из методов лучшую или худшую производительность RMSEP. Я также хотел бы сделать несколько сравнений парных методов.
Мой подход заключается в подборе модели линейных смешанных эффектов (LME) с одним случайным эффектом для Run . Я использовал lmer()
из пакета lme4 для соответствия моей модели и функций из пакета multcomp для выполнения множественных сравнений. Моя модель была по сути
lmer(RMSEP ~ method + (1 | Run), data = FOO)
где method
- коэффициент, указывающий, какой метод использовался для генерации прогнозов модели для тестового набора, и Run
индикатор для каждого конкретного прогона моего «эксперимента».
Мой вопрос касается остатков ЛБМ. Учитывая единственный случайный эффект для прогона, я предполагаю, что значения RMSEP для этого прогона в некоторой степени коррелированы, но не коррелированы между прогонами на основе индуцированной корреляции, которую дает случайный эффект.
Является ли это предположение о независимости между пробегами действительным? Если нет, то есть ли способ объяснить это в модели LME или я должен использовать другой тип статического анализа для ответа на мой вопрос?