Я новичок в статистике и пытаюсь понять разницу между ANOVA и линейной регрессией. Я использую R, чтобы исследовать это. Я читал различные статьи о том, почему ANOVA и регрессия различны, но все еще одинаковы, и как их можно визуализировать и т. Д. Я думаю, что я там довольно, но один бит все еще отсутствует.
Я понимаю, что ANOVA сравнивает дисперсию внутри групп с дисперсией между группами, чтобы определить, есть ли разница между какой-либо из протестированных групп. ( https://controls.engin.umich.edu/wiki/index.php/Factor_analysis_and_ANOVA )
Что касается линейной регрессии, я нашел сообщение на этом форуме, в котором говорится, что то же самое можно проверить, когда мы проверяем, равен ли b (наклон) = 0. ( Почему ANOVA преподается / используется так, как если бы это была другая методология исследования по сравнению с линейной регрессией? )
Для более чем двух групп я нашел сайт, на котором было написано:
Нулевая гипотеза:
Модель линейной регрессии:
Однако результатом линейной регрессии является перехват для одной группы и разница с этим перехватом для двух других групп. ( http://www.real-statistics.com/multiple-regression/anova-using-regression/ )
Для меня это выглядит так, что на самом деле перехваты сравниваются, а не наклоны?
Другой пример, где они сравнивают перехваты, а не наклоны, можно найти здесь: ( http://www.theanalysisfactor.com/why-anova-and-linear-regression-are-the-same-analysis/ )
Я сейчас пытаюсь понять, что на самом деле сравнивается в линейной регрессии? склоны, перехваты или оба?