В Размышлении быстро и медленно» Даниэль Канеман ставит следующий гипотетический вопрос:
(Стр. 186). Джули в настоящее время является старшим в государственном университете. Она бегло читала, когда ей было четыре года. Какой у нее средний балл (GPA)?
Его намерение состоит в том, чтобы проиллюстрировать, как мы часто не учитываем регрессию к среднему значению при прогнозировании определенных статистических данных. В последующем обсуждении он советует:
(Стр. 190) Напомним, что корреляция между двумя показателями - в данном случае возраст чтения и средний балл - равна доле общих факторов среди их детерминант. Что вы думаете об этой пропорции? Мое самое оптимистичное предположение составляет около 30%. Исходя из этой оценки, у нас есть все, что нам нужно для непредвзятого прогноза. Вот инструкции о том, как добраться за четыре простых шага:
- Начните с оценки среднего балла.
- Определите средний балл, который соответствует вашему впечатлению о доказательствах.
- Оцените корреляцию между скоростями чтения и ГПД.
- Если корреляция равна .30, переместите 30% расстояния от среднего значения до соответствующего GPA.
Моя интерпретация его совета такова:
- Используйте «Она бегло читает, когда ей было четыре года», чтобы установить стандартную оценку скороспелости Джулии.
- Определите средний балл, который имеет соответствующий стандартный балл. (Рациональный ГПД для прогнозирования соответствовал бы этому стандартному баллу, если бы корреляция между ГПД и скоростями чтения была идеальной.)
- Оцените, какой процент вариаций в GPA можно объяснить вариациями в скоростях чтения. (Я предполагаю, что он имеет в виду контекст определения «корреляция» в этом контексте?)
- Поскольку только 30% стандартного показателя скороспелости Джули могут быть объяснены факторами, которые также могут объяснить стандартную оценку ее ГПД, мы только оправдываем прогнозирование того, что стандартная оценка ГПД Джулии будет составлять 30% от того, что было бы в случае идеальной корреляции.
Правильна ли моя интерпретация процедуры Канемана? Если так, есть ли более формальное математическое обоснование его процедуры, особенно шаг 4? В целом, какова взаимосвязь между корреляцией между двумя переменными и изменениями / различиями в их стандартных баллах?