Предположим, что ваш набор данных состоит из набора для i = 1 , … , n, и вы хотите посмотреть на зависимость y от x .(xi,yi)i=1,…,nyx
Предположим , что вы найдете значения α и β в α и β , которые минимизируют остаточную сумму квадратов
п Е я = 1 ( у я - ( α + β х я ) ) 2 .
Тогда вы берете у = α + β х будет предсказанное у -значение для любого (не обязательно уже наблюдается) х -value. Это линейная регрессия.α^β^αβ
∑i=1n(yi−(α+βxi))2.
y^=α^+β^xyx
Теперь рассмотрим разложение полной суммы квадратов
сп-1степенями свободы, в "объяснено" и "необъяснимые" части:
п Σ я = 1 ( ( α + β х я ) - ˉ у ) 2 ⏟ объяснено+ п Σ я = 1 ( у я - ( α + β х я ) ) 2 ⏟ необъясненный.
с1
∑i=1n(yi−y¯)2where y¯=y1+⋯+ynn
n−1∑i=1n((α^+β^xi)−y¯)2explained + ∑i=1n(yi−(α^+β^xi))2unexplained.
1и
степени свободы соответственно. Это дисперсионный анализ, а затем один считает такие вещи , как F-статистики
F = Е п я = 1 ( ( & alpha ; + & beta ; х я ) - ˉ у ) 2 / 1n−2ЭтаF-статистика проверяет нулевую гипотезу
β=0.
F=∑ni=1((α^+β^xi)−y¯)2/1∑ni=1(yi−(α^+β^xi))2/(n−2).
β=0
y=α+βi
ikk−1n−k
Пара дополнительных очков:
- Некоторым математикам приведенный выше отчет может создать впечатление, что целое поле - это только то, что видно выше, поэтому может показаться загадочным, что регрессия и анализ отклонений являются активными областями исследований. Есть много вещей, которые не вписываются в ответ, подходящий для публикации здесь.
- y=α+βx