Что подразумевается под «случайной величиной»?

69

Что они имеют в виду, когда говорят «случайная величина»?

35

Случайная переменная - это переменная, значение которой зависит от неизвестных событий. Мы можем суммировать неизвестные события как «состояние», и тогда случайная величина является функцией состояния.

Пример:

Предположим, у нас есть три броска костей ( , , ). Тогда состояние . $D_{1}$ $D_{2}$ $D_{3}$ $S=(D_{1},D_{2},D_{3})$

Одна случайная величина - это число 5. Это: $X$

X = (D_{1} = 5 ?) + (D_{2} = 5 ?) + (D_{3} = 5 ?)

$X=(D_{1}=5?)+(D_{2}=5?)+(D_{3}=5?)$

Другой случайной величиной является сумма бросков костей. Это: $Y$

Y = D_{1} + D_{2} + D_{3}

$Y=D_{1}+D_{2}+D_{3}$

— Павел
источник

Спасибо за четкий и краткий ответ. Возникает вопрос о том, как отделить неизвестное состояние от результата (я полагаю, именно так в теории вероятностей называются область и диапазон «случайной величины»). Кажется, что неизвестное состояние называется a sample, который я просил отличить от результатов . Зачем вам нужно вводить функцию и называть ее случайной величиной, хотя она абсолютно детерминированная и совсем не переменная? Почему вы не можете сразу оценить результат?

— Вал

2

Когда «события» становятся «известными», что происходит со случайной величиной? Согласно этому ответу, он больше не может существовать! Зависимость этого ответа от таких туманных идей, как «известный», который носит чисто субъективный характер, делает его менее чем удовлетворительным в качестве определения или объяснения случайных величин.

— whuber

1

@whuber Английский и другой человеческий язык, безусловно, неточны. Кажется, вы на самом деле выбираете слово «зависит», а не «известно». «является функцией» является более точным, но тогда «неизвестные события» являются расплывчатыми, и поэтому математики определяют «пространство вероятностей», «сигма-алгебру», «измеримые функции» и т. д. Если вам нужно более строгое рассмотрение, Википедия есть: en.wikipedia.org/wiki/Random_variable

— Пол

1

@whuber В то время как википедия бросается к математическому жаргону, чтобы получить точность, я замечаю, что ваш ответ, пример достойного непрофессионала, который хотя и стоит прочитать, требует выполнения около 16 параграфов. Но что сказать студенту, который хочет получить ответ, который занимает 5 секунд, чтобы прочитать? Клиенты ценят краткость в определениях.

— Пол

5

Это измеримая вещественная функция на вероятностном пространстве. По моим оценкам, с каждым из этих технических терминов - «измеримая», «реальнозначная функция» и «пространство вероятностей» я потеряла 90% потенциальной аудитории, и только 0,1% фактически поняли и оценили определение. Кстати, это чисто математическое определение. Это бесполезно до тех пор, пока не будет указано, как его можно применить к реальной статистической проблеме, но, по крайней мере, это правильно (если не полностью).

— whuber

69

Введение

Размышляя над недавним комментарием, я замечаю, что все ответы до сих пор страдают от использования неопределенных терминов, таких как «переменная», и расплывчатых терминов, таких как «неизвестный», или обращаются к техническим математическим понятиям, таким как «функция» и «пространство вероятностей». Что мы должны сказать нематематическому человеку, который хотел бы получить простое, интуитивно понятное и в то же время точное определение «случайной величины»? После некоторых предварительных описаний простой модели случайных явлений я приведу такое определение, которое достаточно короткое, чтобы поместиться в одну строку. Поскольку это может не полностью удовлетворить cognoscenti , впоследствии объясняется, как расширить это до обычного технического определения.

Билеты в коробке

Один из способов приблизиться к идее случайной переменной - обратиться к модели случайности с билетами в коробке . Эта модель заменяет эксперимент или наблюдение коробкой, полной билетов. На каждом билете написан возможный результат эксперимента. (Результат может быть таким же простым, как «головы» или «хвосты», но на практике это более сложная вещь, такая как история цен на акции, полная запись длинного эксперимента или последовательность всех слов в документе .) Все возможные результаты появляются хотя бы один раз среди билетов; некоторые результаты могут появиться на многих билетах.

Вместо того, чтобы фактически проводить эксперимент, мы представляем, что тщательно - но вслепую - смешиваем все билеты и выбираем только один. Если мы можем показать, что реальный эксперимент должен вести себя так, как если бы он проводился таким образом, то мы сведем потенциально сложный (и дорогой, и длительный) эксперимент в реальном мире к простому, интуитивно понятному, мысленному эксперименту (или «статистической модели»). «). Ясность и простота, обеспечиваемые этой моделью, позволяют анализировать эксперимент.

Пример

Стандартные примеры касаются результатов бросания монет и игральных костей и розыгрыша игральных карт. Это несколько отвлекает их тривиальностью, поэтому для иллюстрации предположим, что мы обеспокоены итогами президентских выборов в США в 2016 году. В качестве (крошечного) упрощения я буду считать, что одна из двух основных партий - республиканская (R) или демократический (Д) - победит. Поскольку (с имеющейся в настоящее время информацией) результат неясен, мы представляем, что билеты нужно положить в коробку: некоторые с надписью «R», а другие с «D». Наша модель результата - нарисовать ровно один билет из этой коробки.

Чего-то не хватает: мы еще не оговорили, сколько будет билетов на каждый результат. Фактически, выяснение этого является основной проблемой статистики: на основании наблюдений (и теории), что можно сказать об относительных пропорциях каждого результата в рамке?

(Я надеюсь, что ясно, что пропорции каждого вида билетов в коробке определяют его свойства, а не фактические номера каждого билета. Пропорции определяются - как обычно - как количество билетов каждого вида, деленное на общее количество билетов. Например, ящик с одним билетом "D" и одним билетом "R" ведет себя точно так же, как ящик с миллионом билетов "D" и миллионом билетов "R", потому что в любом случае каждый тип 50% всех билетов и, следовательно, каждый из них имеет 50% шанс быть разыгранным, когда билеты тщательно перемешаны.)

Делая модель количественной

Но давайте не будем заниматься этим вопросом здесь, потому что мы близки к нашей цели определения случайной величины. Проблема с моделью до сих пор состоит в том, что она не поддается количественной оценке, в то время как мы хотели бы иметь возможность ответить на количественные вопросы с ней. И я имею в виду не тривиальные, а реальные практические вопросы, такие как: «Если моя компания инвестирует миллиард евро в разработку морского ископаемого топлива в США, насколько изменится стоимость этих инвестиций в результате выборов 2016 года» ?» В этом случае модель настолько проста, что мы мало что можем сделать, чтобы получить реалистичный ответ на этот вопрос, но мы могли бы пойти так далеко, чтобы проконсультироваться с нашими экономическими сотрудниками и узнать их мнение о двух возможных результатах:

Если победят демократы, насколько изменятся инвестиции? (Предположим, ответ - долларов.) $d$
Если республиканцы победят, насколько это изменится? (Предположим, что ответ - долларов.) $r$

Ответы числа. Чтобы использовать их в модели, я попрошу своих сотрудников просмотреть все билеты в коробке и на каждом билете «D» написать « долларов», а на каждом билете «R» написать « долларов». Теперь мы можем четко и количественно смоделировать неопределенность в инвестициях: их изменение стоимости после выборов равнозначно получению суммы денег, записанной на одном билете, случайно выбранном из этой ячейки. $d$ $r$

Эта модель помогает нам ответить на дополнительные вопросы об инвестициях. Например, насколько неопределенным мы должны быть о стоимости инвестиций ? Хотя существуют (простые) математические формулы для этой неопределенности, мы могли бы достаточно точно воспроизвести их ответы, просто используя нашу модель многократно - возможно, тысячу раз - чтобы увидеть, какие на самом деле происходят результаты и измерить их разброс. Модель «билеты в коробке» дает нам возможность количественно рассуждать о неопределенных результатах.

Случайные переменные

Чтобы получить количественные ответы о неопределенных или переменных явлениях, мы можем принять модель билета в коробке и записать числа на билетах. Этот процесс написания чисел должен следовать только одному правилу: он должен быть последовательным. В этом примере на каждом билете Демократической партии должно быть написано « долларов» - без исключений - и на каждом билете республиканцев должны быть написаны « долларов». $d$ $r$

Случайная величина является любым последовательным способом записать номера на билетах в коробке.

(Математическая запись для этого - дать имя процессу перенумерации, обычно с заглавной латинской буквой, такой как или Идентификационная информация, написанная на билетах, часто именуется маленькими буквами, как правило, (строчная греческая) omega "). Значение, связанное с помощью случайной переменной с билетом , обозначается как . В этом примере мы можем сказать что-то вроде:" - это случайная переменная, представляющая изменение стоимости инвестиции Msgstr "Это было бы полностью указано, указав и $X$ $Y$ $\omega$ $X$ $\omega$ $X(\omega)$ $X$ $X(\text{D})=d$ $X(\text{R}) = r$ , В более сложных случаях значения задаются более сложными описаниями и, часто, формулами. Например, билеты могут представлять годовую цену закрытия акции, а случайная переменная может быть значением в определенный момент времени некоторой производной на этой акции, такой как опцион пут. Опционный контракт описывает, как рассчитываетсяТрейдеры опционов используют именно такую модель для оценки своей продукции.) $X$ $X$ $X$

Вы заметили, что такой является ни случайным, ни переменной? Не является ли он «неопределенным» или «неизвестным». Это определенное назначение (чисел для результатов), то, что мы можем записать с полным знанием и полной уверенностью. Что является случайным, так это процесс получения билета из коробки; то , что это переменная величина на билете , который может быть обращено. $X$

Обратите также внимание на четкое разделение двух разных вопросов, связанных с оценкой инвестиций: я попросил своих экономистов определить для меня, но не высказывать мнения о результатах выборов. Я буду использовать другую информацию (возможно, позвонив политическим консультантам, астрологам, используя доску Уиджа или что-то еще), чтобы оценить пропорции каждого из билетов "D" и "R", чтобы положить их в коробку. $X$

После: об измеримости

Когда определение случайной величины сопровождается предупреждением «измеримым», то, что имеет в виду определитель, является обобщением модели «билеты в коробке» на ситуации с бесконечным числом возможных результатов. (Технически это необходимо только при бесчисленных бесконечных результатах или в тех случаях, когда речь идет о иррациональных вероятностях, и даже в последнем случае этого можно избежать.) При бесконечном количестве результатов трудно сказать, какой будет доля общего числа. Если бесконечно много «D» билетов и бесконечно «R» билетов, каковы их относительные пропорции? Мы не можем узнать с помощью простого деления одной бесконечности на другую!

В этих случаях нам нужен другой способ указать пропорции. «Измеримый» набор билетов - это любая коллекция билетов в коробке, для которой может быть определена их пропорция. Когда это сделано, число, о котором мы думаем как о «пропорции», называется «вероятностью». (Не каждая коллекция билетов должна иметь вероятность, связанную с этим.)

В дополнение к удовлетворению требования согласованности, случайная величина должна позволять нам вычислять вероятности, которые связаны с естественными вопросами о результатах. В частности, нам нужна уверенность в том, что вопросы вида «какова вероятность того, что значение будет лежать между такими-то и такими-то ( ) и такими-то-такими ( )?» на самом деле будут иметь математически четкие ответы, независимо от того, какие два значения мы даем для пределов и . Такие процедуры переписывания называются «измеримыми». Все случайные величины должны быть измеримыми по определению. $X$ $X(\omega)$ $a$ $b$ $a$ $b$

— Whuber
источник

7

Для тех, кто ранее не был знаком со случайными переменными или моделями билетов в коробке, быстрое интерактивное учебное пособие на моем веб-сайте quantdec.com/envstats/notes/class_06/tutorial.htm содержит практические рекомендации и некоторые дополнительные концепции.

— whuber

2

Рабочий пример, иллюстрирующий эти концепции, представлен на stats.stackexchange.com/a/68782 .

— whuber

2

NB Я подозреваю, что многие люди используют термин «население» примерно в смысле билетов в коробке. Я избегаю этой терминологии, потому что она звучит слишком похоже на то, что мы можем создавать только вероятностные модели для выборки реальных (физических) групп населения. Даже в тех случаях, когда проводится выборка физического населения, редко бывает идеальное взаимно-однозначное соответствие между ним и билетами. Например, никто никогда не сможет перечислить живых китайцев 1 января 2014 года, отчасти из-за неопределенности относительно того, когда люди рождаются, когда они умирают и даже являются ли они китайцами.

— whuber

4

@jsk Вступление к этому ответу объясняет, почему такая забота казалась необходимой. Хотя верно и то, что два других ответа в этой теме содержат правильное и полное определение («измеримая функция из вероятностного пространства в измеримое пространство, известное как пространство состояний»), это определение неявно требует понимания предварительных сведений о сигма-алгебрах, вероятностных мерах, и измеримые функции. Читатели будут жаловаться на то, что это материал для выпускников .

— whuber

4

@ user4205580 Для чисто математического определения «согласованность» вообще не нужна, потому что для математика случайная величина просто «задана». Для статистических приложений, как обсуждалось здесь, это важное условие, потому что многие данные не являются числовыми: случайные переменные должны быть построены так, чтобы это подходило для модели и аналитических целей. Вы можете решить для себя, есть ли какая-то ценность для вас в этом концептуальном различии.

— whuber

16

Неформально случайная величина - это способ присвоения числового кода каждому возможному результату. *

Пример 1

Я подбрасываю монету. Множество возможных результатов (также называемое «пробным пространством») может быть записано как . $\{H,T\}$

В качестве примера случайной величины можно присвоить и . Таким образом, головы "кодируются" как а хвосты "кодируются" как . $X$ $X(H)=1$ $X(T)=0$ $1$ $0$

Пример 2

Я вытягиваю карту из стандартной колоды из 52 карт. Множество возможных исходов:

{A ♠, K ♠, \dots, 2 ♠, A ♡, K ♡, \dots, 2 ♡, A ♢, K ♢, \dots, 2 ♢, A ♣, K ♣, \dots, 2 ♣} .

$\{A♠, K♠, \dots, 2♠, A♡, K♡, \dots, 2♡, A♢, K♢, \dots, 2♢, A♣, K♣, \dots, 2♣ \}.$

В бридже туз приносит 4 очка с высокими картами, король 3, королева 2 и валет 1. Любая другая карта приносит 0 очков.

Таким образом, мы можем позволить быть соответствующей случайной величиной, где, например, , и , $Y$ $Y\left(A♡ \right)=4$ $Y\left(J♣ \right)=1$ $Y\left(7♠ \right)=0$

Какой смысл случайных величин? Один простой ответ заключается в том, что абстрактные символы, такие как « », « » или « », иногда сложны и трудны в обращении. Поэтому мы вместо этого переводим их в числа, которыми легче манипулировать. $H$ $T$ $A♠$

* Формально случайная величина - это функция, которая отображает каждый результат (в пространстве выборки) на действительное число.

— Кенни ЖЖ
источник

5

+1. Этот ответ доходит до сути, является правильным и ясным - тем самым избегая бессмысленности в отношении «неизвестных» и «меняющихся» значений, которые пронизывают другие ответы в этой теме.

— whuber

12

В отличие от обычной переменной, случайная переменная не может быть заменена одним неизменным значением. Скорее могут быть указаны статистические свойства, такие как распределение случайной величины. Распределение - это функция, которая обеспечивает вероятность того, что переменная примет заданное значение или попадет в диапазон, заданный определенными параметрами, такими как среднее значение или стандартное отклонение.

Случайные переменные могут быть классифицированы как дискретные, если распределение описывает значения из счетного набора, такого как целые числа. Другая классификация для случайной величины является непрерывной и используется, если распределение охватывает значения из бесчисленного множества, такого как действительные числа.

— остроносая плоскодонная шлюпка
источник

2

Вероятно, лучше не использовать термин «нормальная переменная» здесь, когда вы не имеете в виду нормально распределенную случайную величину.

— Роб Хиндман

Согласовано. Хотя я лично на несколько секунд посмотрел бы на кого-нибудь забавного, если бы он сказал «нормальная переменная» и не бросил туда слово «случайный» или «распределенный», чтобы убедить меня, что это то, что они обсуждали. Но я также инженер, а не статистик, поэтому я не использую столько специфичных для предметной области обозначений.

— Шарпи

7

Случайные переменные могут быть классифицированы как сдержанные, если они не привлекают к себе внимания. Если они просто исчисляются, мы говорим дискретно: - P Кроме того, вы имеете в виду «предписывать, а не запрещать», но я думаю, что описание может быть более подходящим. В любом случае, хороший ответ - надеюсь, +1 поможет смягчить придирки!

— walkytalky

@walkytalky Спасибо за исправления - я сделал несколько исправлений.

— Шарпи

1

Любая переменная является заполнителем для значения. Вы можете присвоить то или иное значение переменной (иногда набор значений, которые вы можете назначить, ограничен набором, называемым типом ). Переменные, которые содержат одно неизменное значение, называются «константами». Может быть, вы хотели сказать, что случайная величина сохраняет известное значение, тогда как значение случайной величины неизвестно? Это противоречит другим ответам, в которых говорится, что случайная переменная вообще не является переменной - это функция, которая (детерминистически) отображает неизвестное состояние во что-то другое. Они говорят, что это не случайно и не является переменной.

— Val

6

Мне рассказали эту историю:

Случайную переменную можно сравнить со Священной Римской империей: Священная Римская империя не была святой, она не была римской и не была империей.

Точно так же случайная переменная не является ни случайной, ни переменной. Это просто функция. (история была рассказана здесь: источник ).

Это, по крайней мере, простой способ объяснить, который может помочь людям вспомнить!

— Къетил б Халворсен
источник

3

Из Википедии :

В математике (особенно в теории вероятностей и статистике) случайная величина (или стохастическая переменная) является (в общем) измеримой функцией, которая отображает пространство вероятностей в измеримое пространство. Случайные переменные, отображающие все возможные результаты события в действительные числа, часто изучаются в элементарной статистике и используются в науках для прогнозирования на основе данных, полученных в результате научных экспериментов. Помимо научных приложений были разработаны случайные величины для анализа азартных игр и случайных событий. Полезность случайных величин происходит от их способности фиксировать только математические свойства, необходимые для ответа на вероятностные вопросы.

С cnx.org :

Случайная переменная - это функция, которая присваивает уникальные числовые значения всем возможным результатам случайного эксперимента при фиксированных условиях. Случайная переменная - это не переменная, а функция, которая отображает события в числа.

— Мехпер С. Палавузлар
источник

4

Ни одно из определений cnx.org не является правильным: первое из-за его расплывчатого - и, возможно, вводящего в заблуждение - использования «уникальных» и «фиксированных условий», а второе - потому что оно просто неверно; RV определяется по результатам (элементам выборочного пространства), а не по событиям (измеримым наборам результатов).

— whuber

Одна проблема, которую я вижу с этим определением, состоит в том, что функции плотности не всегда являются функциями плотности вероятности. То есть предположим, что мы пишем, что давление газа в сосуде, протекающем в вакууме, равно , затем и - это функция плотности, площадь которой под кривой равна 1. При этом P не является вероятностью, это давление, определяемое по истечении времени, т. е. хотя имеет форму PDF, это не модель для гистограммы результатов.

P = κ λ e^{- λ t}

$P=\kappa \lambda e^{-\lambda t}$

κ = \int_{0}^{\infty} P (t) d t

$\kappa=\int_0^\infty P(t) dt$

E D (t) = λ e^{- λ t}

$ED(t)=\lambda e^{-\lambda t}$

E D (t)

$ED(t)$

— Карл

1

Другими словами, лучше не говорить, что pdf - это случайная переменная, потому что это иногда детерминированная модель для случайной переменной, а иногда детерминированная модель для детерминированного процесса, как в примере выше. То, чем pdf никогда не был, является случайным, то есть полностью определяется как без комнаты для маневра.

f (x)

$f(x)$

— Карл

3

Случайная переменная, обычно обозначаемая X, является переменной, в которой результат является неопределенным. Наблюдение за конкретным результатом этой переменной называется реализацией. Более конкретно, это функция, которая отображает пространство вероятностей в измеримое пространство, обычно называемое пространством состояний. Случайные переменные являются дискретными (могут принимать различные значения) или непрерывными (могут принимать бесконечное количество значений).

Рассмотрим случайную величину X, которая является суммой, полученной при броске двух кубиков. Он может принимать любое из значений 2-12 (с равной вероятностью при условии справедливой игры в кости), и результат будет неопределенным до тех пор, пока кости не будут брошены.

— Грэм Куксон
источник

5

Просто мысль, но это звучит так, как будто вы говорите, что вероятность выпадения 12 (1/36) равна 7 (1/6).

— Jefflovejapan

0

В моих университетских исследованиях, не связанных с математикой, нам говорили, что случайная переменная - это карта значений, которые переменная может принять для вероятностей. Это позволило нарисовать распределения вероятностей

Недавно я понял, насколько это отличается от того, что математики имеют в виду. Оказывается, что под случайной величиной они подразумевают простую функцию X: Ω → R, которая берет элемент выборочного пространства Ω ( иначе говоря, билет или индивидуум , как объяснено выше) и переводит его в действительное число R в диапазоне ( -∞, ∞). То есть выше было метко отмечено, что это не случайно и вообще не является переменной. Случайность обычно приходит с вероятностной мерой P как часть пространства мер (Ω, P). P отображает выборки в R, аналогично случайной переменной, но этот диапазон времени ограничен [0,1], и мы можем сказать, что случайная переменная переводит (Ω, P) в (R, P), таким образом, случайная переменная снабжена вероятностью измерить P: R -> [0,1], чтобы вы могли сказать для каждого x в R, какова вероятность его появления.

Я не знаю, зачем вам нужны такие случайные переменные и почему вы не можете сэмплировать элементы R в первую очередь, но кажется, что перевод сэмплов в числовые значения позволяет нам упорядочить сэмплы, нарисовать распределение и вычислить ожидание. Я получил эту идею, читая Учебное пособие по теории мер (Теория измерений для чайников). Может быть, математики лучше разбираются в применении случайных величин, но я не могу найти их в своем лишнем исследовании. Тот же текст предполагает, что вам не нужно всегда преобразовывать выборки в числа, особенно для вычисления энтропии для алфавита $\Omega$

H (Ω) = \sum P (Ω_{i}) l n (Ω_{i})

$H(\Omega) = \sum{P(\Omega_i) ln (\Omega_i)}$

Интеграл не нуждается в каких-либо реальных значениях случайной величины.

— Val
источник

На самом деле, математики выходят за рамки этого. может принимать значения в произвольном множестве , которое снабжено некоторой -algebra .

X

$X$

A

$A$

σ

$\sigma$

A

$\mathcal{A}$

— Интеграл