Давайте поговорим о том, что можно увидеть из беглого взгляда на сюжет и некоторых проверок на разумность (именно такие вещи можно делать как само собой разумеющееся при просмотре данных, просто вооружившись несколькими основными фактами):
Тем не менее, обратите внимание , давайте сначала , что версия -denominator стандартного отклонения не может превышать половины диапазона (в знаменатель версию можно, но с более , чем несколько не много наблюдений).Nn - 1
Диапазоны по обеим переменным составляют порядка 0,02 (примерно), поэтому отклонения должны составлять не более половины этого значения в квадрате или около .10- 4
Следовательно, наблюдаемые значения отклонений в вашем выводе имеют смысл; они оба меньше этого, но более десятой части.
Абсолютное значение ковариации должно быть не более, чем среднее геометрическое двух дисперсий (в противном случае корреляция может превышать 1). Таким образом, абсолютное значение ковариации не должно превышать произведения диапазонов.14
Поэтому, если диапазон обеих переменных был близок к , мы не могли ожидать, что абсолютная ковариация превысит .0.02( 0,02 )2/ 4= 10- 4
Из этого очень грубого анализа ничего не выглядит удивительным.
Более точный анализ получается из фактического выполнения расчетов с использованием более точных диапазонов, а затем обдумывания форм предельных распределений:
диапазоны чуть меньше и соответственно, поэтому ковариация не должна превышать , но поскольку маргинальные распределения не являются почти симметричными двухточечными, оно должно быть немного меньше этого.0,0230,0158,6 × 10- 5
В самом деле, если мы скажем, что они не так далеки от однородности, ковариация будет ограничена чем-то ближе к 1/12 продукта, а не к 1/4, т. Е. Для примерно одинаковых вариаций с этими диапазонами это будет меньше, чем примерно - но не намного меньше, потому что корреляция высокая.
[Эти вариации не одинаковы - они оставлены наклонными - но это достаточно близко для наших нынешних целей.]2,9 × 10- 5
Поэтому, просто взглянув на диапазон каждой переменной и приблизительное представление о предельных распределениях и корреляции на графике, я ожидал бы, что ковариация будет немного меньше, чем . Это на самом деле около .2,9 × 10- 52,6 × 10- 5
(Не так уж и плохо для быстрого расчета за конверт, начиная с диапазонов до двух значащих цифр!)