Я должен сделать бинарную логистическую регрессию с большим количеством независимых переменных. Большинство из них являются двоичными, но некоторые из категориальных переменных имеют более двух уровней.
Как лучше всего справиться с такими переменными?
Например, для переменной с тремя возможными значениями я предполагаю, что необходимо создать две фиктивные переменные. Затем, в пошаговой процедуре регрессии, лучше проверить обе фиктивные переменные одновременно или проверить их по отдельности?
Я буду использовать SPSS, но не очень хорошо помню, так: как SPSS справляется с этой ситуацией?
Кроме того, для порядковой категориальной переменной, хорошо ли использовать фиктивные переменные, которые воссоздают порядковый масштаб? (Например, используя три фиктивные переменные для порядковой переменной с 4 состояниями, укажите 0-0-0
уровень, 1-0-0
Для уровня, 1-1-0
Для уровняи 1-1-1
для уровня, Вместо того , чтобы 0-0-0
, 1-0-0
, 0-1-0
и 0-0-1
для 4 уровней.)