Почему среднее 0 и стандартное отклонение 1 всегда используются?

15

Моя статистика была самоучкой, но многие материалы, которые я прочитал, указывают на набор данных, имеющий среднее значение 0 и стандартное отклонение 1.

Если это так, то:

Почему среднее значение 0 и SD 1 - это хорошее свойство?
Почему случайная величина, взятая из этой выборки, равна 0,5? Вероятность получения 0,001 равна 0,5, поэтому это должно быть равномерное распределение ...
Когда люди говорят о Z Scores, что они на самом деле имеют в виду здесь?

probability

— Джек Када
источник

11

В начале наиболее полезным ответом, вероятно, является то, что среднее значение 0 и sd 1 математически удобно. Если вы можете определить вероятности для распределения со средним значением 0 и стандартным отклонением 1, вы можете определить их для любого аналогичного распределения баллов с помощью очень простого уравнения.
Я не слежу за этим вопросом. Среднее значение 0 и стандартное отклонение 1 обычно относятся к стандартному нормальному распределению, часто называемому кривой кривой. Наиболее вероятным значением является среднее значение, и оно уменьшается по мере удаления от вас. Если у вас действительно плоское распределение, то нет более вероятной ценности, чем другая. Ваш вопрос здесь плохо сформирован. Вы смотрели на вопросы о монетах возможно? Посмотрите биномиальное распределение и центральную предельную теорему.
"значит здесь"? Где? Простой ответ для z-показателей заключается в том, что они являются вашими оценками, масштабированными так, как если бы ваше среднее значение было 0, а стандартное отклонение было равно 1. Другой способ думать об этом состоит в том, что он принимает индивидуальный показатель как число стандартных отклонений, которое этот показатель соответствует жадный. Уравнение рассчитывает (оценка - среднее) / стандартное отклонение. Причины, по которым вы делаете это, весьма разнообразны, но одна из них заключается в том, что на курсах по вводной статистике у вас есть таблицы вероятностей для разных z-показателей (см. Ответ 1).

Если бы вы сначала посмотрели z-счет, даже в википедии, вы бы получили довольно хорошие ответы.

— John
источник

На 2) Я полагаю, что путаница - это то, что означает p (X = .01), когда X - непрерывная случайная величина. Интуитивно понятно, что вероятность везде равна нулю, потому что нет шансов, что X точно равен 0,01. Опрашивающий должен рассмотреть определение функции плотности в непрерывном случае, который определяется как производная от кумулятивной функции плотности.

— Тристан

7

Для начала мы поговорим о стандартном нормальном распределении, нормальном распределении со средним значением 0 и стандартном отклонении 1. Сокращением для переменной, которая распространяется как стандартное нормальное распределение, является Z.

Вот мои ответы на ваши вопросы.

(1) Я думаю, что есть две ключевые причины привлекательности стандартных нормальных распределений. Во-первых, любая нормально распределенная переменная может быть преобразована или преобразована в стандартную норму путем вычитания ее среднего значения из каждого наблюдения перед делением каждого наблюдения на стандартное отклонение. Это называется Z-преобразованием или созданием Z-показателей. Это очень удобно, особенно в дни до компьютеров.

\begin{aligned} \frac{({Икс}_{я} - \bar{Икс})}{σ_{Икс}} & знак равно Z \\ \frac{(75 - 65,6)}{10,2} & знак равно 0,9215 \end{aligned}

$\begin{aligned} \frac{(x_i - \bar x)}{\sigma_x} &= Z \\ \frac{(75 - 65.6)}{10.2} &= 0.9215 \end{aligned}$

Вторая причина, по которой стандартное нормальное распределение часто используется, заключается в том, что интерпретация дается в терминах Z-показателей. Каждое «наблюдение» в Z-преобразованной переменной представляет собой количество стандартных отклонений исходного нетрансформированного наблюдения от среднего значения. Это особенно удобно для стандартизированных тестов, где исходная или абсолютная производительность менее важна, чем относительная производительность.

(2) Я здесь не следую за тобой. Я думаю, что вы можете быть озадачены тем, что мы подразумеваем под кумулятивной функцией распределения. Обратите внимание, что ожидаемое значение стандартного нормального распределения равно 0, и это значение соответствует значению .5 в связанной кумулятивной функции распределения.

\begin{aligned} \frac{({Икс}_{я} - \bar{Икс})}{σ_{Икс}} & знак равно Z \\ \frac{(75 - 65,6)}{10,2} & знак равно 0,9215 \end{aligned}

$\begin{aligned} \frac{(x_i - \bar x)}{\sigma_x} &= Z \\ \frac{(75 - 65.6)}{10.2} &= 0.9215 \end{aligned}$ Z-оценка в этом случае составляет 0,9215. Интерпретация Z-показателя заключается в том, что эта конкретная женщина на 0,9215 стандартных отклонений выше среднего роста. Человек, который был 55,4 дюйма ростом, имел Z-показатель 1 и был бы на 1 стандартное отклонение ниже среднего роста.

— Грэм Куксон
источник

1

Поскольку вы получили отличные объяснения от Грэма и Джона, я просто собираюсь ответить на ваш последний вопрос:

Когда люди говорят о Z Scores, что они на самом деле имеют в виду здесь?

Лучший способ ответить на этот вопрос - подумать над этим вопросом: оценки в классе CS 101 обычно распределяются $\mu$ = 80 и $\sigma$ = 5. Что такое z-оценка для 65 класса?

Итак: (65-80) / 5 = -3

Вы можете сказать, что z-оценка для 65-го класса равна -3 ; или другими словами 3 стандартное отклонение влево.

— adhg
источник