Вопреки другим ответам, я бы сказал, что вы можете что-то сказать о способностях Bolts, учитывая имеющиеся данные. Прежде всего, давайте сузим ваш вопрос. Вы спрашиваете о самом быстром человеке, но, поскольку есть разница в распределении скоростей бега для мужчин и женщин, где лучшие женщины-бегуны кажутся немного медленнее, чем лучшие мужчины-бегуны, мы должны сосредоточиться на мужчинах-бегунах. Чтобы получить некоторые данные, мы можем посмотреть на лучшие летние показатели на 100 пробежках за последние 45 лет . Есть несколько вещей, чтобы заметить об этих данных:
- Это лучшие времена бега, поэтому они говорят не о способностях всех людей, а о минимально достигнутых скоростях.
- Мы предполагаем, что эти данные отражают выборку лучших бегунов в мире. Хотя могло случиться, что были даже лучшие бегуны, которые не участвовали в чемпионатах, это предположение кажется довольно разумным.
Сначала давайте обсудим, как не анализировать эти данные. Вы могли заметить, что если мы построим график времени работы в зависимости от времени, мы увидим сильную линейную зависимость.
Это может привести к тому, что вы будете использовать линейную регрессию, чтобы предсказать, насколько лучше бегунов мы сможем наблюдать в следующие годы. Это, однако, было бы очень плохой идеей, которая неизбежно приведет вас к выводу, что примерно через две тысячи лет люди смогут пробежать 100 метров за ноль секунд, и после этого они начнут достигать отрицательного времени бега! Это, очевидно, абсурдно, поскольку мы можем представить, что существует какой-то биологический и физический предел наших возможностей, который нам неизвестен.
Как вы могли бы проанализировать эти данные? Во-первых, обратите внимание, что мы имеем дело с данными о минимальных значениях, поэтому мы должны использовать соответствующую модель для таких данных. Это приводит нас к рассмотрению моделей теории экстремальных значений (см., Например, книгу Стюарта Коулса « Введение в статистическое моделирование экстремальных значений »). Для этих данных можно принять обобщенное экстремальное распределение значений (GEV). Если где - независимые и одинаково распределенные случайные величины, тогда следует распределению GEV. Если вы заинтересованы в моделировании минимас, то если являются образцами минимас, тоY=max(X1,X2,…,Xn)X1,X2,…,XnYiZ1,Z2,…,Zk−Ziследите за распределением GEV для минимас Таким образом, мы можем приспособить распределение GEV к данным о скоростях бега, что приводит к хорошему совпадению (см. Ниже).
Если вы посмотрите на кумулятивное распределение, предложенное моделью, вы заметите, что лучшее время выполнения по Усэйну Болту находится в самом низком1%Хвост распределения. Так что, если мы будем придерживаться этих данных и анализа игрушечного примера, мы заключим, что гораздо меньшее время выполнения маловероятно (но, очевидно, возможно). Очевидная проблема этого анализа заключается в том, что он игнорирует тот факт, что из года в год мы наблюдаем улучшение лучших показателей времени работы. Это возвращает нас к проблеме, описанной в первой части ответа, то есть к тому, что допущение регрессионной модели здесь рискованно. Еще одна вещь, которая может быть улучшена, заключается в том, что мы можем использовать байесовский подход и исходить из информативного априора, который бы учитывал некоторые не зависящие от данных знания о физиологически возможных временах работы, которые могли бы еще не наблюдаться (но, насколько я знаю, это неизвестно в настоящее время). Наконец, подобная теория экстремальных значений уже использовалась в спортивных исследованиях, например, Einmahl and Magnus (2008) вОтчеты в легкой атлетике через статью экстремальной теории .
Вы могли бы возразить, что вы спрашивали не о вероятности более быстрого бега, а о вероятности наблюдения более быстрого бегуна. К сожалению, здесь мы мало что можем сделать, так как не знаем, какова вероятность того, что бегун станет профессиональным спортсменом, и ему будет доступно записанное время бега. Это не происходит случайно, и существует множество факторов, способствующих тому, что некоторые бегуны становятся профессиональными спортсменами, а некоторые нет (или даже то, что кому-то нравится бегать и бегать вообще). Для этого нам понадобятся подробные данные о бегунах для всего населения, более того, поскольку вы спрашиваете об экстремальных значениях распределения, данные должны быть очень большими. Поэтому я согласен с другими ответами.