Кажется, что-то в нашем человеческом понимании создает трудности для интуитивного понимания идеи дисперсии. В узком смысле ответ немедленен: квадрат отбрасывает нас от нашего рефлексивного понимания. Но это только дисперсия, которая представляет проблемы, или это вся идея распространения в данных? Мы ищем убежище в диапазонеИли просто указав минимум и максимум, но мы просто избегаем реальной трудности? В среднем (мода или медиана) мы находим центр, резюме ... упрощение; Разница распространяет вещи вокруг и делает их неудобными. Первобытный человек определенно использовал бы среднее значение в охоте на животных, триангулируя молитву, но я полагаю, что гораздо позже мы почувствовали необходимость количественно оценить распространение вещей. Фактически, термин дисперсия был впервые введен Рональдом Фишером совсем недавно, в 1918 году, в статье «Корреляция между родственниками в предположении о менделевском наследовании».
Большинство людей, которые следят за новостями, услышали бы историю о неудачной речи Ларри Саммерса о математических способностях к полу , которые, возможно, были связаны с его отъездом из Гарварда. В двух словах, он предложил более широкое расхождение в распределении математической компетенции среди мужчин по сравнению с женщинами, хотя оба пола имели одинаковое среднее значение. Независимо от целесообразности или политических последствий, это, кажется, обосновано в научной литературе .
Что еще более важно, возможно, понимание вопросов, таких как изменение климата - пожалуйста, прости меня за то, что я поднял темы, которые могли бы привести к совершенно неуместным дискуссиям - населению могло бы помочь лучшее знакомство с идеей отклонения.
Проблема усугубляется, когда мы пытаемся понять ковариантность, как показано в этом посте , где представлен замечательный и красочный ответ @whuber здесь .
Может быть заманчиво отклонить этот вопрос как слишком общий, но ясно, что мы обсуждаем его косвенно, как в этом посте , где математика тривиальна, но концепция продолжает оставаться неуловимой, опровергая более комфортное принятие диапазона как в отличие от более тонкой идеи отклонения .
В письме от Фишера к EBFord , касающемся противоречия по поводу его подозрений в экспериментах Менделяна , мы читаем: «Теперь, когда данные были сфальсифицированы, я очень хорошо знаю, как в целом люди недооценивают частоту отклонений с большой вероятностью , так что тенденция всегда заставлять их слишком хорошо соглашаться с ожиданиями ... отклонения [по данным Менделя] невероятно малы ». Великий Р.А. Фишер настолько увлечен подозрением о небольших отклонениях в небольших выборках, что пишет : «среди прочего, существует вероятность того, что Мендель был обманут каким-то помощником, который слишком хорошо знал, что ожидалось».
И вполне возможно, что этот уклон к занижению или неправильному пониманию распространения сохраняется и сегодня. Если да, то есть ли какое-то объяснение тому, почему мы более довольны концепциями центральности, чем дисперсией? Что мы можем сделать, чтобы усвоить идею?
Некоторые понятия мы «видим» в одно мгновение, а потом не видим, но принимаем их и движемся дальше. Например, или , но нам не нужно даже знать об этих личностях, чтобы принимать решения в нашей повседневной жизни. То же самое не относится к дисперсии. Итак, не должно ли это быть более интуитивным?E = m c 2
Нассим Талеб разбогател, применяя свое (ну, в действительности, Бенуа Мандельброта ) восприятие ошибочного понимания дисперсии для использования во времена кризиса, и пытался сделать концепцию понятной для масс с помощью таких предложений, как «дисперсия дисперсии эпистемологически мера отсутствия знаний об отсутствии знаний о среднем »- да, у этого глотка больше контекста ... И, к его чести, он также упростил идею « Благодарения Турции » . Можно утверждать, что ключом к инвестированию является понимание дисперсии (и ковариации).
Итак, почему это так скользко, и как исправить это? Без формул ... только интуиция лет борьбы с неопределенностью ... Я не знаю ответа, но он не математический (обязательно, то есть): например, мне интересно, мешает ли идея куртоза дисперсии. На следующем графике мы имеем две гистограммы, перекрывающиеся практически с одной и той же дисперсией; тем не менее, реакция моего коленного рефлекса состоит в том, что тот, у кого самые длинные хвосты и самый высокий пик (более высокий эксцесс), более «разложен»: