Я надеюсь, что кто-то может помочь исправить ситуацию для меня. Скажем, я хочу проверить, существенно ли отличаются два набора коэффициентов регрессии друг от друга, с помощью следующей настройки:
- , с 5 независимыми переменными.
- 2 группы, с примерно равными размерами (хотя это может варьироваться)
- Тысячи подобных регрессий будут выполняться одновременно, поэтому необходимо выполнить некоторую коррекцию множественных гипотез.
Один из подходов, который мне предложили, - это использовать Z-тест:
Еще один совет, который я видел на этой доске, - ввести фиктивную переменную для группировки и переписать модель следующим образом:
, где - группирующая переменная, закодированная как 0, 1.
Мой вопрос: как эти два подхода различны (например, сделаны разные предположения, гибкость)? Является ли один более подходящим, чем другой? Я подозреваю, что это довольно просто, но любые разъяснения будут с благодарностью.