Оригинальный плакат попросил ответить «объясни мне как 5». Допустим, ваш школьный учитель приглашает вас и ваших одноклассников помочь угадать ширину стола учителя. Каждый из 20 учеников в классе может выбрать устройство (линейку, шкалу, ленту или критерий) и может измерить таблицу 10 раз. Вас всех просят использовать разные начальные местоположения на устройстве, чтобы не читать одно и то же число снова и снова; затем начальное чтение должно быть вычтено из конечного значения, чтобы в итоге получить одно измерение ширины (вы недавно узнали, как выполнять этот тип математики).
Всего было проведено 200 измерений ширины (20 учеников, по 10 измерений в каждом). Наблюдения передаются учителю, который будет анализировать числа. Вычитание наблюдений каждого учащегося из контрольного значения приведет к еще 200 числам, которые называются отклонениями . Средние учителя образец каждого студента в отдельности, получение 20 средств . Вычитание наблюдений каждого учащегося из их индивидуального среднего значения приведет к 200 отклонениям от среднего значения, которые называются невязками . Если бы средний остаток был рассчитан для каждой выборки, вы бы заметили, что он всегда равен нулю. Если вместо этого мы возведем в квадрат каждый остаток, усредним их и, наконец, отменим квадрат, мы получим стандартное отклонение, (Кстати, мы называем этот последний расчетный бит квадратным корнем (подумайте о нахождении основания или стороны данного квадрата), поэтому для краткости всю операцию часто называют среднеквадратичным ; стандартное отклонение наблюдений равно среднеквадратичное значение остатков.)
Но учитель уже знал истинную ширину стола, основываясь на том, как он был спроектирован, изготовлен и проверен на заводе. Таким образом, еще 200 чисел, называемых ошибками , могут быть рассчитаны как отклонение наблюдений относительно истинной ширины. Средняя ошибка может быть вычислена для каждого студента образца. Аналогично, для наблюдений можно рассчитать стандартное отклонение ошибки или стандартную ошибку . Больше 20 среднеквадратичная ошибказначения также могут быть рассчитаны. Три набора из 20 значений соотносятся как sqrt (me ^ 2 + se ^ 2) = rmse, в порядке появления. На основании rmse учитель может судить, чей ученик предоставил наилучшую оценку ширины стола. Кроме того, рассматривая отдельно 20 средних ошибок и 20 стандартных значений ошибок, учитель может проинструктировать каждого ученика, как улучшить свои чтения.
В качестве проверки учитель вычитал каждую ошибку из соответствующей средней ошибки, в результате чего получилось еще 200 чисел, которые мы назовем остаточными ошибками (что не часто делается). Как и выше, средняя остаточная ошибка равна нулю, поэтому стандартное отклонение остаточных ошибок или стандартная остаточная ошибка совпадает со стандартной ошибкой , и на самом деле то же самое относится и к среднеквадратичной остаточной ошибке . (Подробнее см. Ниже.)
Теперь вот что-то интересное для учителя. Мы можем сравнить каждое среднее значение ученика с остальной частью класса (всего 20 означает). Так же, как мы определили до этих значений точек:
- m: среднее (из наблюдений),
- s: стандартное отклонение (наблюдений)
- я: средняя ошибка (из наблюдений)
- se: стандартная ошибка (из наблюдений)
- rmse: среднеквадратичная ошибка (наблюдений)
мы также можем определить сейчас:
- мм: среднее значение
- см: стандартное отклонение от среднего
- mem: средняя ошибка среднего
- sem: стандартная ошибка среднего
- rmsem: среднеквадратичная ошибка среднего
Только если класс студентов называется беспристрастным, т. Е. Если mem = 0, то sem = sm = rmsem; т. е. стандартная ошибка среднего значения, стандартное отклонение среднего значения и среднеквадратичная ошибка среднего значения могут быть одинаковыми при условии, что средняя ошибка среднего равна нулю.
Если бы мы взяли только одну выборку, т. Е. Если в классе был только один студент, стандартное отклонение наблюдений можно использовать для оценки стандартного отклонения среднего значения (см), как sm ^ 2 ~ s ^ 2 / n, где n = 10 - размер выборки (количество чтений на одного учащегося). Эти два лучше согласятся с ростом размера выборки (n = 10,11, ...; больше чтений на одного учащегося) и увеличением числа образцов (n '= 20,21, ...; больше учеников в классе). (Предостережение: неквалифицированная «стандартная ошибка» чаще относится к стандартной ошибке среднего значения, а не к стандартной ошибке наблюдений.)
Вот некоторые детали расчетов. Истинное значение обозначено т.
Операции с заданными точками:
- значит: СРЕДСТВО (X)
- среднеквадратичное значение: RMS (X)
- стандартное отклонение: SD (X) = RMS (X-MEAN (X))
ВНУТРЕННИЕ ОБРАЗЦЫ НАБОРОВ:
- наблюдения (данные), X = {x_i}, i = 1, 2, ..., n = 10.
- отклонения: разность множества относительно фиксированной точки.
- остатки: отклонение наблюдений от их среднего значения, R = Xm.
- ошибки: отклонение наблюдений от истинного значения, E = Xt.
- Остаточные ошибки: отклонение ошибок от их среднего значения, RE = E-MEAN (E)
ВНУТРЕННИЕ ОБРАЗЦЫ (см. Таблицу 1):
- m: среднее (из наблюдений),
- s: стандартное отклонение (наблюдений)
- я: средняя ошибка (из наблюдений)
- se: стандартная ошибка наблюдений
- rmse: среднеквадратичная ошибка (наблюдений)
МНОЖЕСТВЕННЫЕ (АНСАМБЛЬНЫЕ) НАБОРЫ:
- означает, что M = {m_j}, j = 1, 2, ..., n '= 20.
- остатки от среднего: отклонение средних от их среднего, RM = М-мм.
- ошибки среднего: отклонение среднего от «истины», EM = Mt.
- Остаточные ошибки среднего: отклонение ошибок среднего от их среднего, REM = EM-MEAN (EM)
МЕЖПРОВОДНЫЕ (АНСАМБЛЬНЫЕ) ТОЧКИ (см. Таблицу 2):
- мм: среднее значение
- см: стандартное отклонение от среднего
- mem: средняя ошибка среднего
- sem: стандартная ошибка (среднего)
- rmsem: среднеквадратичная ошибка среднего