Может быть, это полезно для некоторых людей, разделяющих такое же интуитивное понимание. Мы все видели что-то вроде этого:
r=0.66
Как уже отмечали другие, значения выборки коррелируют, но это не означает, что популяция имеет ненулевую корреляцию.
Конечно, эти два должны быть независимыми - учитывая, что Николас Кейдж появился в рекордных 10 фильмах в этом году, мы не должны закрывать местный бассейн на лето в целях безопасности.
Но когда мы проверяем, сколько людей утонуло в этом году, маловероятно, что в этом году утонут рекордные 1000 человек.
Получение такой корреляции маловероятно. Может быть, один из тысячи. Но это возможно, хотя оба они независимы. Но это только один случай. Учтите, что существуют миллионы возможных событий, которые вы можете измерить, и вы можете увидеть вероятность того, что шансы некоторых двух, дающих высокую корреляцию, достаточно высоки (отсюда и существование графиков, подобных приведенному выше).
Другой способ взглянуть на это состоит в том, что гарантия того, что два независимых события всегда будут давать некоррелированные значения, сама по себе ограничительна. Учитывая два независимых кубика и результаты первого, существует определенный (значительный) набор результатов для второго кубика, который даст некоторую ненулевую корреляцию. Ограничение результатов второй кости, чтобы дать нулевую корреляцию с первой, является явным нарушением независимости, так как броски первой кости теперь влияют на распределение результатов.