Хотя точная вероятность не может быть вычислена (за исключением особых обстоятельств с ), она может быть быстро рассчитана численно с высокой точностью. Несмотря на это ограничение, можно строго доказать, что у бегуна с наибольшим стандартным отклонением есть наибольшие шансы на победу. На рисунке изображена ситуация и показано, почему этот результат интуитивно очевиден:n≤2
Показана плотность вероятности для времен пяти бегунов. Все они непрерывны и симметричны относительно общего среднего . (Масштабированные бета-плотности использовались для обеспечения положительного времени.) Одна плотность, выделенная темно-синим цветом, имеет гораздо больший разброс. Видимая часть в его левом хвосте представляет времена, с которыми обычно не может сравниться ни один другой бегун. Поскольку этот левый хвост с относительно большой площадью представляет значительную вероятность, у бегуна с такой плотностью больше всего шансов выиграть гонку. (У них также больше всего шансов прийти последним!)μ
Эти результаты доказаны не только для нормальных распределений: представленные здесь методы в равной степени применимы к симметричным и непрерывным распределениям . (Это будет интересно всем, кто возражает против использования нормальных распределений для моделирования времени выполнения.) Когда эти предположения нарушаются, возможно, что у бегуна с наибольшим стандартным отклонением не будет наибольшего шанса на победу (я оставляю конструкцию контрпримеров для заинтересованным читателям), но мы все еще можем доказать при более мягких предположениях, что у бегуна с самым большим SD будет лучший шанс на победу при условии, что SD достаточно велик.
На рисунке также показано, что такие же результаты могут быть получены при рассмотрении односторонних аналогов стандартного отклонения (так называемой «вариабельности»), которые измеряют дисперсию распределения только в одну сторону. У бегуна с большим разбросом влево (к лучшим временам) должен быть больше шанс выиграть, независимо от того, что происходит в остальной части распределения. Эти соображения помогают нам понять, как свойство быть лучшим (в группе) отличается от других свойств, таких как средние.
Пусть - случайные величины, представляющие время бегунов. Вопрос предполагает, что они независимы и нормально распределены с общим средним значением μ . (Хотя это буквально невозможная модель, поскольку она дает положительные вероятности для отрицательных времен, она все же может быть разумным приближением к реальности, если стандартные отклонения существенно меньше, чем μ .)X1,…,Xnμμ
Чтобы выполнить следующий аргумент, сохраните предположение о независимости, но в противном случае предположите, что распределения задаются F i, и что эти законы распределения могут быть любыми. Для удобства также предположим, что распределение F n непрерывно с плотностью f n . Позже, при необходимости, мы можем применить дополнительные допущения, если они включают случай нормальных распределений.XiFiFnfn
Для любого и бесконечно малого d y вероятность того, что последний бегун имеет время в интервале ( y - d y , y ] и является самым быстрым бегуном, получается путем умножения всех соответствующих вероятностей (поскольку все времена независимы):ydy(y−dy,y]
Pr(Xn∈(y−dy,y],X1>y,…,Xn−1>y)=fn(y)dy(1−F1(y))⋯(1−Fn−1(y)).
Интеграция во все эти взаимоисключающие возможности дает
Pr(Xn≤min(X1,X2,…,Xn−1))=∫Rfn(y)(1−F1(y))⋯(1−Fn−1(y))dy.
Для нормальных распределений этот интеграл не может быть оценен в замкнутой форме, когда : он требует численной оценки.n>2
На этом рисунке изображены подынтегральные функции для каждого из пяти бегунов со стандартными отклонениями в соотношении 1: 2: 3: 4: 5. Чем больше SD, тем больше функция смещена влево - и тем больше становится ее площадь. Области примерно 8: 14: 21: 26: 31%. В частности, у бегуна с самым большим SD есть шанс выиграть 31%.
Хотя закрытая форма не может быть найдена, мы все же можем сделать убедительные выводы и доказать, что бегун с самым большим SD, скорее всего, победит. Нам нужно изучить, что происходит при изменении стандартного отклонения одного из распределений, скажем, . Когда случайная величина X n масштабируется на σ > 0 вокруг ее среднего значения, ее SD умножается на σ и f n ( y ) d y изменится на f n ( y / σ ) d y / σFnXnσ>0σfn(y)dyfn(y/σ)dy/σ, Изменение переменной в интеграле дает выражение для вероятности выигрыша бегуна n как функцию σ :y=xσnσ
ϕ(σ)=∫Rfn(y)(1−F1(yσ))⋯(1−Fn−1(yσ))dy.
Предположим теперь, что медианы всех распределений равны и что все распределения симметричны и непрерывны с плотностями f i . (Это, безусловно, имеет место в условиях вопроса, потому что нормальное медиана является его средним значением.) Простым (локальным) изменением переменной мы можем предположить, что эта общая медиана равна 0 ; симметрия означает f n ( y ) = f n ( - y ) и 1 - F j ( - y ) = F j ( y)nfi0fn(y)=fn(−y) Для всех у . Эти соотношения позволяют нам объединить интеграл по ( - ∞ , 0 ] с интегралом по ( 0 , ∞ ), чтобы получить1−Fj(−y)=Fj(y)y(−∞,0](0,∞)
ϕ(σ)=∫∞0fn(y)(∏j=1n−1(1−Fj(yσ))+∏j=1n−1Fj(yσ))dy.
Функция дифференцируема. Его производная, полученная дифференцированием подынтегрального выражения, представляет собой сумму интегралов, где каждый член имеет видϕ
yfn(y)fi(yσ)(∏j≠in−1Fj(yσ)−∏j≠in−1(1−Fj(yσ)))
для .i=1,2,…,n−1
Сделанные нами предположения о распределениях были разработаны таким образом, чтобы гарантировать, что при x ≥ 0 . Таким образом, поскольку x = y σ ≥ 0 , каждый член в левом произведении превышает соответствующий ему член в правом произведении, подразумевая, что разность продуктов неотрицательна. Другие факторы y f n ( y ) f i ( y σ ) явно неотрицательны, потому что плотности не могут быть отрицательными иFj(x)≥1−Fj(x)x≥0x=yσ≥0yfn(y)fi(yσ) . Мы можем заключить, что ϕ ′ ( σ ) ≥ 0 при σ ≥ 0 , доказывая, чтовероятность того, что игрок n выиграет, увеличивается со стандартным отклонением X n .y≥0ϕ′(σ)≥0σ≥0nXn
nXnXi1/nnnn