В контексте социальных наук, откуда я родом, вопрос заключается в том, заинтересованы ли вы в (а) прогнозировании или (б) тестировании целенаправленного исследовательского вопроса. Если целью является прогнозирование, то подходы, основанные на данных, являются подходящими. Если цель состоит в том, чтобы исследовать сфокусированный вопрос исследования, важно рассмотреть, какая регрессионная модель конкретно проверяет ваш вопрос.
Например, если ваша задача состояла в том, чтобы выбрать набор тестов отбора для прогнозирования производительности работы, цель в некотором смысле можно рассматривать как максимизацию прогнозирования производительности работы. Таким образом, подходы, основанные на данных, были бы полезны.
Напротив, если вы хотите понять относительную роль переменных личности и переменных способностей в влиянии на производительность, тогда может быть более подходящим подход сравнения конкретной модели.
Обычно при изучении сфокусированных вопросов исследования цель состоит в том, чтобы выяснить что-то об основных причинных процессах, которые работают, в отличие от разработки модели с оптимальным прогнозированием.
Когда я нахожусь в процессе разработки моделей процесса, основанных на данных поперечного сечения, я бы с осторожностью отнесся к: (а) включению предикторов, которые теоретически могут рассматриваться как последствия переменной результата. Например, убеждение человека в том, что он хороший исполнитель, является хорошим предиктором эффективности работы, но вполне вероятно, что это хотя бы частично вызвано тем фактом, что они наблюдали за собственной работой. (б) включая большое количество предикторов, которые отражают одни и те же основные явления. Например, в том числе 20 пунктов, все измерить удовлетворенность жизнью по-разному.
Таким образом, сфокусированные исследовательские вопросы в большей степени зависят от предметных знаний. Вероятно, это объясняет, почему подходы, основанные на данных, реже используются в социальных науках.