У меня было несколько вопросов о том, как интерпретировать отношения шансов для непрерывных переменных в логистической регрессии. Я чувствую, что это основные вопросы о логистической регрессии (и, вероятно, о регрессии в целом), и, хотя мне немного стыдно, что я не знаю ответов, я проглочу свою гордость и задам их, чтобы я знал их в будущее!
Вот моя ситуация ... Я рассматриваю выборку осужденной молодежи, которая в рамках стажировки была зачислена в программу обучения навыкам работы / жизненным навыкам. Я хотел увидеть, в какой степени возраст, в котором они были освобождены от участия в программе, предсказывал занятость через шесть месяцев после выхода из программы.
(Также имейте в виду, что в модели есть другие предикторы, но я исключил их, потому что они не являются статистически значимыми, и я хочу, чтобы это было как можно более ясным.)
Предиктор: возраст освобождения от программы обучения (средний возраст = 17,4, SD = 1,2, диапазон 14,3-20,5)
Результат: занят или нет (занят = 1, не занят = 0)
Результат: отношение шансов 3,01 (р <0,005) (я исключил статистику соответствия и т. Д., Потому что я ищу ответы только об интерпретации отношения шансов; я чувствую себя комфортно с оценкой соответствия модели, КИ , так далее.)
Если выразить это словами: если возраст увеличивается на один год, шансы на то, что он будет работать через шесть месяцев после выписки, увеличатся на три единицы.
Вопросов:
1) Когда я говорю: «Когда возраст увеличивается на один год ...», что является отправной точкой для возраста?
Возраст начинается с нуля? Например, «По мере того, как возраст увеличивается с 0 [т.е. самый низкий возраст, если вы должны были разместить эту модель на графике] ...»
Возраст начинается с самого низкого возраста из диапазона возрастов в выборке? Например, «Как возраст увеличивается с 14,3 ...»
ИЛИ
Возраст начинается со среднего возраста образца? Например, «возраст увеличивается с 17,4 ...»,
2) Поможет ли центрирование мне интерпретировать этот результат или это эффективно только при интерпретации y-int? Если бы это помогло, я подумал о том, чтобы либо сосредоточиться, либо вычесть самый низкий возраст в диапазоне из всех других возрастов в выборке. Какие-либо предложения?
3) Наконец, уместно ли сказать, что по сравнению с 14-летней молодежью 17-летняя молодежь имеет в девять раз больше шансов трудоустроиться? Я спрашиваю, потому что знаю, что логистическая регрессия предполагает сигмоидальные отношения, и мне любопытно, остается ли постоянное увеличение шансов на 3 единицы в любой точке вдоль линии регрессии.
Спасибо!
Аарон