В наборе данных из двух непересекающихся групп населения (пациенты и здоровые, всего ) я хотел бы найти (из независимых переменных) значимые предикторы для непрерывной зависимой переменной. Корреляция между предикторами присутствует. Я заинтересован в том, чтобы выяснить, связан ли какой-либо из предикторов с зависимой переменной «в реальности» (а не с максимально точным прогнозированием зависимой переменной). Поскольку я был поражен многочисленными возможными подходами, я хотел бы спросить, какой подход наиболее рекомендуется.
Насколько я понимаю, поэтапное включение или исключение предикторов не рекомендуется
Например, провести линейную регрессию отдельно для каждого предиктора и исправить значения p для множественного сравнения с использованием FDR (возможно, очень консервативно?)
Регрессия главных компонентов: трудно интерпретировать, поскольку я не смогу рассказать о предсказательной силе отдельных предикторов, а только о компонентах.
какие-либо другие предложения?