Один простой подход заключается в следующем.
Для двух вопросов о предпочтениях возьмите абсолютную разницу между ответами двух респондентов, указав две переменные, например z1 и z2, вместо четырех.
Для вопросов важности я мог бы создать оценку, которая комбинирует два ответа. Если бы ответы были, скажем, (1,1), я бы дал 1, a (1,2) или (2,1) получает 2, a (1,3) или (3,1) получает 3, a (2,3) или (3,2) получает 4, а (3,3) получает 5. Давайте назовем это «оценкой важности». Альтернативой было бы просто использовать max (response), давая 3 категории вместо 5, но я думаю, что версия 5 категории лучше.
Я бы сейчас создал десять переменных, x1 - x10 (для конкретности), все со значениями по умолчанию, равными нулю. Для тех наблюдений с оценкой важности для первого вопроса = 1, x1 = z1. Если оценка важности для второго вопроса также = 1, x2 = z2. Для тех наблюдений с оценкой важности для первого вопроса = 2, x3 = z1 и если оценка важности для второго вопроса = 2, x4 = z2 и так далее. Для каждого наблюдения точно один из x1, x3, x5, x7, x9! = 0 и аналогично для x2, x4, x6, x8, x10.
Сделав все это, я запустил логистическую регрессию с двоичным результатом в качестве целевой переменной и х1 - х10 в качестве регрессоров.
Более сложные версии этого могут создать больше оценок важности, позволяя по-разному относиться к важности респондентов мужского и женского пола, например, a (1,2)! = A (2,1), где мы упорядочили ответы по полу.
Недостатком этой модели является то, что вы можете иметь несколько наблюдений за одним и тем же человеком, что означает, что «ошибки», в общем и целом, не являются независимыми в разных наблюдениях. Тем не менее, с большим количеством людей в выборке, я бы просто проигнорировал это, для первого прохода, или построил бы образец, в котором не было дубликатов.
Другой недостаток заключается в том, что по мере увеличения важности влияние данной разницы между предпочтениями на p (сбой) также будет увеличиваться, что подразумевает связь между коэффициентами (x1, x3, x5, x7, x9), а также между коэффициентами (х2, х4, х6, х8, х10). (Вероятно, не полный порядок, поскольку мне априори не ясно, как (2,2) показатель важности соотносится с (1,3) показателем важности.) Однако мы не навязывали это в модели. Я, вероятно, сначала проигнорирую это, и посмотрю, удивлен ли я результатами.
Преимущество этого подхода заключается в том, что он не предполагает никаких предположений о функциональной форме взаимосвязи между «важностью» и различием между ответами на предпочтения. Это противоречит предыдущему недостающему комментарию, но я думаю, что отсутствие навязываемой функциональной формы, вероятно, более выгодно, чем связанная с этим неспособность принять во внимание ожидаемые отношения между коэффициентами.