Пожалуйста, объясните парадокс ожидания


75

Несколько лет назад я разработал детектор излучения, который работает, измеряя интервал между событиями, а не подсчитывая их. Я предполагал, что при измерении несмежных образцов в среднем я буду измерять половину фактического интервала. Однако, когда я тестировал схему с калиброванным источником, показания были в два раза выше, что означало, что я измерял полный интервал.

В старой книге о вероятности и статистике я нашел раздел о чем-то под названием «Парадокс ожидания». В нем приведен пример, в котором автобус прибывает на автобусную остановку каждые 15 минут, а пассажир прибывает наугад, он заявляет, что пассажир в среднем будет ждать полные 15 минут. Я никогда не мог понять математику, представленную на примере, и продолжаю искать объяснения. Если кто-то может объяснить, почему это так, что пассажир ждет полный интервал, я буду спать лучше.


1
Какое название и кто автор книги? Не могли бы вы скопировать пример слово в слово здесь?
Джоэл Рейес Ноч

Это не моя специальность, но является ли парадокс, упомянутый ОП, таким же, как парадокс инспекции ?
Джоэл Рейес Ноч

1
Связанный пост: math.stackexchange.com/questions/222674/…
ddiez

1
Кажется, мое предположение выше имеет некоторую поддержку. В комментарии к этому ответу упоминается парадокс проверки.
Джоэл Рейес Ноч

2
Я думаю, что использование шины, поскольку аналогия сбивает с толку, поскольку автобусы, как правило, следуют расписанию. Вместо этого подумайте, сколько времени займет прибытие пустого такси, когда в среднем каждые 15 минут.
Харви Мотульский

Ответы:


48

Как указал Glen_b, если автобусы прибывают каждые минут без какой-либо неопределенности , мы знаем, что максимально возможное время ожидания составляет минут. Если мы со своей стороны прибудем «наугад», мы чувствуем, что «в среднем» мы будем ждать половину максимально возможного времени ожидания . И максимально возможное время ожидания здесь равно максимально возможной длине между двумя последовательными прибытиями. Обозначим наше время ожидания и максимальную длину между двумя последовательными прибытиями автобуса , и мы утверждаем, что15 Вт Р1515WR

(1)E(W)=12R=152=7.5

и мы правы.

Но неожиданно у нас отнимается определенность, и нам говорят, что теперь минут - это средняя продолжительность между двумя приездами на автобусе. И мы попадаем в «ловушку интуитивного мышления» и думаем: «нам нужно только заменить его ожидаемым значением», и мы споримр15R

(2)E(W)=12E(R)=152=7.5WRONG

Первое указание на то, что мы ошибаемся, это то, что - это не «длина между любыми двумя последовательными прибытиями шины», это « максимальная длина и т. Д.». Так что в любом случае мы имеем .E ( R ) 15RE(R)15

Как мы пришли к уравнению ? Мы подумали: «Время ожидания может быть от до максимум . Я прибываю с равной вероятностью в любом случае, поэтому я« выбираю »случайным образом и с равной вероятностью все возможные времена ожидания. Следовательно, половина максимальной длины между двумя последовательными прибытиями автобусов является моей среднее время ожидания ". И мы правы.0 15(1)015

Но, ошибочно вставив значение в уравнение , оно больше не отражает наше поведение. С вместо , уравнение говорит: «Я выбираю случайным образом и с равной вероятностью все возможные времена ожидания , которые меньше или равны средней длине между двумя последовательными прибытиями автобусов » - и здесь наш интуитивный ошибка заключается, потому, что наше поведение не меняется - так, прибыв случайно равномерно, мы на самом деле до сих пор «выбираем случайным образом и с равной вероятностью» все возможные времен ожидания - но «все возможное время ожидания» является не захвачен( 2 ) 15 E ( R ) ( 2 ) 1515(2)15E(R)(2)15 - мы забыли правый хвост распределения длин между двумя последовательными автобусами.

Поэтому, возможно, нам следует рассчитать ожидаемое значение максимальной длины между любыми двумя последовательными прибытиями автобусов, это правильное решение?

Да, это может быть, но : конкретный «парадокс» идет рука об руку с особым стохастическим предположением: то, что прибытия автобусов моделируются с помощью эталонного пуассоновского процесса, что означает, что как следствие мы предполагаем, что промежуток времени между любые два последовательных прибытия автобусов следуют по экспоненциальному распределению. Обозначим , что длина, и мы имеем , что

f()=λeλ,λ=1/15,E()=15

Это, конечно, приблизительно, поскольку экспоненциальное распределение имеет неограниченную поддержку справа, что означает, что, строго говоря, «все возможные времена ожидания» включают, согласно этому допущению моделирования, большие и большие величины вплоть до «включающей» бесконечности, но с исчезающей вероятностью ,

Но подождите, Экспонента без памяти : независимо от того, в какой момент времени мы прибудем, мы сталкиваемся с одной и той же случайной величиной , независимо от того, что было раньше.

Учитывая это стохастическое / распределительное предположение, любой момент времени является частью «интервала между двумя последовательными прибытиями шины», длина которого описывается тем же распределением вероятности с ожидаемым значением (не максимальным значением) : «Я здесь, я в окружении промежутка между двумя прибытием автобуса. Часть его длины находится в прошлом, а некоторые в будущем, но я не могу знать, сколько и сколько, поэтому лучшее, что я могу сделать, это спросить, какова его ожидаемая длина - какое мое среднее время ожидания? " - И ответ всегда " ", увы. 151515


+1 Очень мило. может читать ? f λ ( )f()fλ()
говорит амеба: восстанови Монику

Благодарю. Что касается обозначений, оба используются для обозначения разных вещей. То, что я написал, - это акцентирование на том, чья плотность случайных величин равна, потому что в различных преобразованиях мы можем получить что-то вроде . То, что вы предлагаете, это подчеркнуть параметризованный аспект плотности. fX(y)
Алекос Пападопулос

80

Если автобус прибывает «каждые 15 минут» (то есть по расписанию), то среднее ожидание пассажира (прибывающего случайным образом) действительно составляет всего 7,5 минуты, потому что он будет равномерно распределен в этом 15-минутном промежутке.

-

Если, с другой стороны, автобус прибывает случайным образом со средней скоростью 4 в час (то есть в соответствии с пуассоновским процессом), то среднее ожидание намного дольше; на самом деле вы можете решить это через отсутствие свойства памяти. Примите прибытие пассажира в качестве начала, и время до следующего события является экспоненциальным со средними 15 минутами.

Позвольте мне провести аналогию с дискретным временем. Представьте, что я бросаю кубик с 15 гранями, одна из которых помечена буквой «B» (для автобуса) и 14 помечена буквой «X» для полного отсутствия автобуса в ту минуту (существуют справедливые 30 односторонних кубиков , поэтому я могу пометить 2 из грани 30-гранной матрицы "B"). Так что раз в минуту я катаюсь и смотрю, приедет ли автобус. У кубика нет памяти; он не знает, сколько бросков с момента последней буквы «Б». А теперь представьте, что происходит какое-то несвязанное событие - собака лает, приезжает пассажир, я слышу грохот грома. Как долго я буду ждать (сколько рулонов) до следующего "B"?

В среднем из-за нехватки памяти я жду следующей буквы «B», а также времени между двумя последовательными буквами «B».

[Затем представьте, что у меня есть шестигранный кубик, который я бросаю каждые пятнадцать секунд (опять же, с одним лицом «В»); Теперь представьте, что у меня был 1000-гранный кубик, который я бросал каждые 0,9 секунды (с одной гранью "B"; или, более реалистично, по три 10-гранных кубика каждый, и я называю результат "B", если все 3 выпадают "10" в в то же время) ... и так далее. В пределе мы получаем непрерывный процесс Пуассона времени.]

Еще один способ взглянуть на это так: я с большей вероятностью наблюдаю за моим событием «начать подсчет бросков» (то есть «пассажир прибывает на автобусную остановку») во время более длительного перерыва, чем короткий, просто правильным способом среднее время ожидания такое же, как и среднее время между автобусами (я в основном жду в длинных промежутках и в основном пропускаю самые короткие; потому что я прибываю в равномерно распределенное время, вероятность того, что я попаду в промежуток длины , пропорциональна )тtt

Как опытный ловец автобусов, на практике реальность, кажется, лежит где-то между «автобусы прибывают по расписанию» и «автобусы прибывают наугад». И иногда (в условиях плохого движения) вы ждете час, а затем 3 прибывают все сразу (Зак указывает причину этого в комментариях ниже).


6
Я думаю, что с автобусами, в частности, есть дополнительный процесс, когда поздний автобус становится позже, когда пассажиры втискиваются в него, и пустой автобус за ним в конце концов догоняет (но остается пустым). = D
Зак

4
@ Zach действительно, поэтому они имеют тенденцию слипаться в течение длительного времени, особенно в условиях интенсивного движения. Там, где я живу, когда автобус ходит слишком поздно, пора идти к следующему, иногда они вставляют дополнительный автобус, который почти вовремя проследует по маршруту (т.е. он будет ехать без пассажиров туда, где автобус будет не очень далеко позади. по расписанию, часто добираясь туда по более быстрому маршруту) и начинайте подбирать пассажиров, для которых сейчас автобус только немного опаздывает. Между тем, очень поздний автобус теперь становится фактически следующим автобусом в расписании, как только он добирается до того места, куда пришел другой автобус.
Glen_b

@Glen_b Это действительно хорошая идея, ха!
Зак

Это полезная стратегия против слипания (по крайней мере, она смягчает наихудшие случаи); Я бы не стал поднимать этот вопрос, если бы он не касался проблем зависимости, с которыми, возможно, придется иметь дело более точным моделям времени ожидания шины.
Glen_b

10

Больше об автобусах ... Извините, что вступил в разговор так поздно во время дискуссии, но я в последнее время смотрю на процессы Пуассона ... Поэтому, прежде чем это ускользнет из моей памяти, вот графическое представление парадокса проверки :

Ошибка связана с предположением, что, поскольку автобусы следуют определенной схеме прибытия с заданным средним временем прибытия (обратное к параметру скорости Пуассона , назовем его мин. ), появляясь на автовокзале в любое случайное время, вы фактически забираете автобус. Таким образом, если вы приходите на автобусную станцию ​​в случайное время, ведение журнала учета времени ожидания, скажем, одного месяца, фактически даст вам среднее время между прибытием между автобусами. Но это не то, что вы будете делать.θ = 1 / λ = 15λθ=1/λ=15

Если бы мы находились в диспетчерском центре и могли видеть все автобусы на экране, было бы верно, что случайный выбор нескольких автобусов и усреднение расстояния до автобуса, следующего за ним, дали бы среднее время между прибытием:

введите описание изображения здесь

Но если мы вместо этого просто показываем себя на автобусной станции (вместо выбора автобуса), мы делаем случайное сечение времени, скажем, вдоль графика движения автобусов в обычное утро. Время, которое мы решаем показать на автобусной станции, вполне может быть равномерно распределено по «стрелке» времени. Однако, поскольку между шинами, расположенными дальше друг от друга, имеются более длительные временные промежутки, мы с большей вероятностью в конечном итоге преувеличиваем эти «отставшие»:

введите описание изображения здесь

... и, следовательно, наш журнал учета времени ожидания не будет отражать время прибытия. Это парадокс проверки.

Что касается фактического вопроса об OP относительно ожидаемого времени ожидания минут, то ошеломляющее объяснение заключается в отсутствии памяти в процессе Пуассона, которое делает промежуток времени истекшим со времени, когда последний пропущенный нами автобус покинул станции времени мы обнаружиться не имеет значения, и ожидаемое время до прибытия следующего автобуса по- прежнему, упорно, минут. Это лучше всего видно в дискретном времени (геометрическое распределение) с примером игры в кости в ответе Glen_b. θ = 1515θ=15

На самом деле, если бы мы могли знать, как давно ушел предыдущий автобус, минут! Как объясняется в этом видео MIT Джона Цициклиса , нам просто нужно посмотреть, что предшествует точке прибытия как пуассоновский процесс назад во времени:E[time waiting (future) + time to last bus departure (past)]=30


введите описание изображения здесь


Все еще неясно? - попробуй с Легосом .


Отличные диаграммы.
Glen_b

2

Существует простое объяснение, которое разрешает различные ответы, которые можно получить из расчета ожидаемого времени ожидания для автобусов, прибывающих по пуассоновскому процессу с заданным средним временем прохождения (в данном случае 15 минут), чье время прохождения, таким образом, является экспоненциальным со средним значением 15 минут. ,

Метод 1 ) Поскольку процесс Пуассона (экспоненциальный) не имеет памяти, ожидаемое время ожидания составляет 15 минут.

Способ 2 ) Вы также можете прибыть в любое время в течение периода поступления, в который вы приехали. Следовательно, ожидаемое время ожидания составляет 1/2 от ожидаемой продолжительности этого периода поступления. ЭТО ПРАВИЛЬНО и не противоречит методу (1).

Как (1) и (2) оба могут быть правильными? Ответ заключается в том, что ожидаемая продолжительность межповерочного периода для времени, в которое вы прибываете, не равна 15 минутам. Это на самом деле 30 минут; и 1/2 из 30 минут составляет 15 минут, поэтому (1) и (2) согласны.

Почему период поступления для времени, к которому вы прибываете, не равен 15 минутам? Это связано с тем, что, сначала «фиксируя» время прибытия, период, в котором он находится, скорее всего, чем в среднем, будет длинным периодом поступления. В случае экспоненциального периода поступления, математика работает так, что период поступления, содержащий время, в которое вы прибываете, является экспонентой с удвоенным средним временем поступления для пуассоновского процесса.

Не очевидно, что точное распределение времени взаимодействия, содержащее время, в которое вы прибываете, будет экспоненциальным с удвоенным средним, но после объяснения очевидно, почему оно увеличивается. В качестве простого для понимания примера, скажем, что интервал времени составляет 10 минут с вероятностью 1/2 или 20 минут с вероятностью 1/2. В этом случае периоды поступления продолжительностью 20 минут одинаково вероятны, как и периоды поступления продолжительностью 10 минут, но когда они происходят, они длятся вдвое дольше. Таким образом, 2/3 временных точек в течение дня будут в моменты времени, когда межповерочный период составляет 20 минут. Другими словами, если мы сначала выберем время, а затем захотим узнать, каково время взаимодействия, содержащее это время, (игнорируя переходные эффекты в начале «дня» ) ожидаемая продолжительность этого времени поступления составляет 16 1/3. Но если мы сначала выберем время прохождения и захотим узнать его ожидаемую продолжительность, то это 15 минут.

Существуют и другие варианты парадокса обновления, выборки с смещением по длине и т. Д., Которые в значительной степени совпадают.

Пример 1) У вас есть несколько лампочек со случайным сроком службы, но в среднем 1000 часов. Когда лампочка выходит из строя, она немедленно заменяется другой лампочкой. Если вы выберете время, чтобы войти в комнату с лампочкой, лампочка в рабочем состоянии будет иметь более длительный средний срок службы, чем 1000 часов.

Пример 2) Если мы идем на строительную площадку в данное время, то среднее время, пока строительный рабочий, который там работает в это время, падает со здания (с момента, когда они впервые начали работать), больше, чем среднее время до того, как рабочий падает (с того момента, когда они впервые начали работать) из числа всех работников, которые начинают работать. Почему, потому что рабочие с коротким средним временем до падения больше, чем в среднем, уже отвалились (и не продолжают работать), так что рабочие, работающие в таком случае, дольше, чем в среднем, до падения.

Пример 3) Выберите случайное количество людей в городе случайным образом и, если они посещали домашние игры (не все распродажи) городской бейсбольной команды Высшей лиги, выясните, сколько людей посетили игры, в которых они участвовали. Затем (при некоторых слегка идеализированных, но не слишком необоснованных предположениях) средняя посещаемость этих игр будет выше, чем средняя посещаемость всех домашних игр команды. Почему? Поскольку больше людей посещают игры с высокой посещаемостью, чем игры с низкой посещаемостью, вы с большей вероятностью выберете людей, которые посещали игры с высокой посещаемостью, чем игры с низкой посещаемостью.


0

Был поставлен вопрос: «... автобус прибывает на автобусную остановку каждые 15 минут, а пассажир прибывает наугад». Если автобус прибывает каждые 15 минут, то это не случайно; он прибывает каждые 15 минут, поэтому правильный ответ составляет 7,5 минут. Либо источник был неверно процитирован, либо автор источника был небрежным.

С другой стороны, детектор излучения звучит как другая проблема, потому что радиационные события приходят случайным образом в соответствии с некоторым распределением, предположительно что-то вроде Пуассона со средним временем ожидания.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.