В Kahneman and Deaton (2010) † авторы пишут следующее:
Эта регрессия объясняет 37% дисперсии с среднеквадратической ошибкой (RMSE) 0,67852. Чтобы исключить выбросы и отчеты о неправдоподобных доходах, мы отбросили наблюдения, в которых абсолютная величина разницы между доходом от журнала и его прогнозом превысила среднеквадратичное значение в 2,5 раза.
Это обычная практика? Что такое интуиция за этим? Кажется несколько странным определять выбросы, основанные на модели, которая, во-первых, может быть не совсем точной. Разве не следует определять выбросы на каких-то теоретических основаниях того, что представляет собой правдоподобную ценность, а не на том, насколько хорошо ваша модель предсказывает реальные значения?
: Даниэль Канеман, Angus Deaton (2010): Высокий доход улучшает оценку жизни, но не эмоциональное благополучие. Слушания Национальной академии наук сентябрь 2010, 107 (38) 16489-16493; DOI: 10.1073 / pnas.1011492107