Каковы наилучшие методы для подбора «режима» данных, взятых из непрерывного распределения?
Поскольку этот режим технически не определен (верно?) Для непрерывного распространения, я действительно спрашиваю: «Как вы находите наиболее распространенное значение»?
Если вы предполагаете, что родительский дистрибутив является гауссовским, вы можете скопировать данные и найти, скажем, режим - это местоположение бина с наибольшим количеством. Тем не менее, как вы определяете размер корзины? Доступны ли надежные реализации? (т. е. устойчив к выбросам). Я использую python
/ scipy
/ numpy
, но я, вероятно, могу перевести R
без особых затруднений.