Ответы:
OLS ( обычные наименьшие квадраты ) предполагает, что значения, представленные горизонтальными расстояниями, либо предопределены экспериментатором, либо измерены с высокой точностью (относительно вертикальных расстояний). Когда возникает вопрос неопределенности горизонтальных расстояний, вам не следует использовать OLS, вместо этого следует изучить модели с ошибками в переменных или, возможно, анализ главных компонентов .
Интересный вопрос. Мой ответ будет таким: когда мы подбираем модель OLS, мы неявно и в первую очередь пытаемся предсказать / объяснить имеющуюся зависимую переменную - «Y» в «Y против X». Таким образом, нашей главной задачей было бы минимизировать расстояние от нашей подогнанной линии до фактических наблюдений относительно результата, что означает минимизацию вертикального расстояния. Это, конечно, определяет остатки.
Кроме того, формулы наименьших квадратов легче вывести, чем большинство других конкурирующих методов, поэтому, возможно, поэтому он появился первым. :П
Как намекает на вышеизложенное, существуют и другие подходы, в которых X и Y рассматриваются с равным акцентом при подборе наиболее подходящей линии. Один такой подход, о котором я знаю, - это регрессия «главных линий» или «главных кривых», которая минимизирует ортогональные расстояния между точками и линией (вместо вертикальных линий ошибок у вас есть линии под углом 90 градусов к подгоночной линии) , Я размещаю одну ссылку ниже для вашего чтения. Это долго, но очень доступно и поучительно.
Надеюсь, это поможет, Бренден
Возможно, это также относится к запланированным экспериментам - если x является контролируемой величиной, которая является частью плана эксперимента, она считается детерминированной; в то время как у является результатом, и является случайной величиной. х может быть непрерывной величиной (например, концентрация какого-либо лекарственного средства), но может делиться на 0/1 (что приводит к t-критерию с двумя образцами при условии, что у - гауссов). Если x является непрерывной величиной, может быть некоторая ошибка измерения, но, как правило, если она намного меньше, чем переменность y, то это игнорируется.