Для точек данных , на плоскости нарисуем прямую линию
. Если мы прогнозируем как значение для , то ошибка будет равна , а квадратичная ошибка будет равна
, и общая квадратичная ошибка . Мы просим( х я , у я ) , я = 1 , 2 , ... п у = х + б х я + б у я у я ( у я - у я ) = ( у я - х я - б ) ( у я - а х я - бn(xi,yi),i=1,2,…ny=ax+baxi+by^iyi(yi−y^i)=(yi−axi−b)∑ n i = 1 ( y i - a x i - b ) 2(yi−axi−b)2 ∑ni=1(yi−axi−b)2
Какой выбор и минимизирует
?b S = n ∑ i = 1 ( y i - a x i - b ) 2abS=∑i=1n(yi−axi−b)2
Поскольку - это вертикальное расстояние от прямой линии, мы запрашиваем такую линию, чтобы сумма квадратов вертикальных расстояний точек от линии была такой же маленькой, как возможно. Теперь является квадратичной функцией как и и достигает своего минимального значения, когда и таковы, что
Из второго уравнения получаем
где
( x i , y i ) S a b a b ∂ S(yi−axi−b)(xi,yi)Sabab b=1
∂S∂a∂S∂b=2∑i=1n(yi−axi−b)(−xi)=2∑i=1n(yi−axi−b)(−1)=0=0
μy=1b=1n∑i=1n(yi−axi)=μy−aμx
yixia=( 1μy=1n∑i=1nyi, μx=1n∑i=1nxi - среднее арифметическое значения и соответственно. Подставляя в первое уравнение, мы получаем
Таким образом, линия, которая минимизирует может быть выражена как
и минимальное значение составляет
yixiSy=ax+b=μy+((1a=(1n∑ni=1xiyi)−μxμy(1n∑ni=1x2i)−μ2x.
SSSmin=[(1y=ax+b=μy+((1n∑ni=1xiyi)−μxμy(1n∑ni=1x2i)−μ2x)(x−μx),
SSmin=[(1n∑ni=1y2i)−μ2y][(1n∑ni=1x2i)−μ2x]−[(1n∑ni=1xiyi)−μxμy]2(1n∑ni=1x2i)−μ2x.
Если мы поменяемся ролями и , нарисуем линию
и запросим значения
и которые минимизируют
то есть мы хотим, чтобы линия была такой, чтобы сумма квадратов горизонтальных расстояний точек от линия как можно меньше, то мы получимxyx=a^y+b^a^b^
T=∑i=1n(xi−a^yi−b^)2,
x=a^y+b^=μx+((1n∑ni=1xiyi)−μxμy(1n∑ni=1y2i)−μ2y)(y−μy)
и минимальное значение is
TTmin=[(1n∑ni=1y2i)−μ2y][(1n∑ni=1x2i)−μ2x]−[(1n∑ni=1xiyi)−μxμy]2(1n∑ni=1y2i)−μ2y.
Обратите внимание, что обе линии проходят через точку
но наклоны имеют
в целом отличаются. Действительно, как указывает @whuber в комментарии, наклоны одинаковы, когда все точки лежат на одной прямой линии. Чтобы увидеть это, обратите внимание, что
(μx,μy)
a=(1n∑ni=1xiyi)−μxμy(1n∑ni=1x2i)−μ2x, a^−1=(1n∑ni=1y2i)−μ2y(1n∑ni=1xiyi)−μxμy
(xi,yi)a^−1−a=Smin(1n∑ni=1xiyi)−μxμy=0⇒Smin=0⇒yi=axi+b,i=1,2,…,n.