Я предвосхищу этот ответ, поскольку я полностью согласен с Гэвином, и если вы заинтересованы в подборе любой модели, это должно отражать изучаемое явление. Проблема в том, что логика определения любых и всех эффектов (и то, на что ссылается Гэвин, когда он говорит, что дноуглубление данных) состоит в том, что вы можете разместить бесконечное число взаимодействий или квадратичных терминов для переменных или преобразований в ваших данных, и вы неизбежно найдет "существенные" эффекты для некоторой вариации ваших данных.
Как утверждает chl, эти эффекты взаимодействия более высокого порядка на самом деле не имеют никакой интерпретации, и часто даже взаимодействия более низкого порядка не имеют никакого смысла. Если вы заинтересованы в разработке причинно-следственной модели, вы должны включать только те термины, которые, по вашему мнению, могут иметь отношение к вашей зависимой переменной A priori для соответствия вашей модели.
Если вы считаете, что они могут повысить предсказательную силу вашей модели, вам следует поискать ресурсы по методам выбора моделей, чтобы не допустить чрезмерного соответствия вашей модели.