Я посещаю занятия по анализу данных, и некоторые из моих укоренившихся идей потрясены. А именно, идея о том, что ошибка (эпсилон), как и любой другой вид дисперсии, применима только (как я думал) к группе (выборке или целому населению). Теперь нас учат, что одним из допущений регрессии является то, что дисперсия «одинакова для всех людей». Это как-то шокирует меня. Я всегда думал, что именно дисперсия Y по всем значениям X считается постоянной.
Я поговорил с профессором, который сказал мне, что когда мы делаем регрессию, мы предполагаем, что наша модель верна. И я думаю, что это сложная часть. Для меня термин «ошибка» (epsilon) всегда означал что-то вроде «каких-либо элементов, которые мы не знаем и которые могут повлиять на нашу переменную результата, плюс некоторая ошибка измерения». В том, как преподается класс, нет такой вещи, как «другие вещи»; наша модель считается верной и полной. Это означает, что все остаточные отклонения следует рассматривать как произведение ошибки измерения (таким образом, можно ожидать, что измерение отдельного человека в 20 раз приведет к той же дисперсии, что и измерение 20 человек за один раз).
Я чувствую, что где-то что-то не так, я хотел бы получить некоторое экспертное мнение по этому вопросу ... Есть ли место для интерпретации того, что такое термин ошибки, концептуально говоря?