Решение
Пусть два средних будут и μ y, а их стандартные отклонения будут σ x и σ yμxμyσxσy соответственно. Поэтому разница во времени между двумя поездками ( ) имеет среднее значение μ y - μ x и стандартное отклонение √Y−Xμy−μx . Стандартизированная разница («z балл»)σ2x+σ2y−−−−−−√
z=μy−μxσ2x+σ2y−−−−−−√.
Если время вашего пробега не имеет странного распределения, вероятность того, что поездка займет больше времени, чем поездка X , приблизительно равна нормальному кумулятивному распределению Φ , оцененному в точке z .YXΦz
вычисление
Вы можете рассчитать эту вероятность на одном из ваших рейсов, потому что у вас уже есть оценки и т. Д. :-). Для этой цели можно легко запомнить несколько значений ключа из Ф : Ф ( 0 ) = 0,5 = 1 / 2 , Φ ( - 1 ) ≈ 0,16 ≈ 1 / 6 , Φ ( - 2 ) ≈ 0,022 ≈ 1 / +40 , и Φ ( - 3 ) ≈ 0,0013μxΦΦ(0)=.5=1/2Φ(−1)≈0.16≈1/6Φ(−2)≈0.022≈1/40 . (Приближение может быть плохим для | z | намного больше, чем 2 Φ ( z ) = 1 - Φ ( - z ) и небольшим количеством интерполяции вы может быстро оценить вероятность до одной значимой цифры, которая более чем достаточно точна, учитывая природу проблемы и данные.Φ(−3)≈0.0013≈1/750|z|2, но знание помогает в интерполяции.) В сочетании сΦ(−3)Φ(z)=1−Φ(−z)
пример
Предположим, что маршрут занимает 30 минут со стандартным отклонением 6 минут, а маршрут Y занимает 36 минут со стандартным отклонением 8 минут. С достаточным количеством данных, охватывающих широкий диапазон условий, гистограммы ваших данных могут в конечном итоге приблизиться к следующим:XY

(Это функции плотности вероятности для переменных Gamma (25, 30/25) и Gamma (20, 36/20). Обратите внимание, что они решительно смещены вправо, как и следовало ожидать для времени езды.)
потом
μx=30,μy=36,σx=6,σy=8.
Откуда
z=36−3062+82−−−−−−√=0.6.
У нас есть
Φ(0)=0.5;Φ(1)=1−Φ(−1)≈1−0.16=0.84.
Поэтому мы оцениваем ответ как 0,6 от 0,5 до 0,84: 0,5 + 0,6 * (0,84 - 0,5) = приблизительно 0,70. (Правильное, но слишком точное значение для нормального распределения составляет 0,73.)
Существует около 70% вероятности того, что маршрут YX
(Правильная вероятность для показанных гистограмм составляет 72%, хотя ни один из них не является нормальным: это иллюстрирует область применения и полезность нормального приближения для разницы во времени срабатывания.)