Очень вероятная причина корреляции двух переменных заключается в том, что их изменения связаны с третьей переменной. Другими вероятными причинами являются случайность (если вы протестируете достаточно некоррелированных переменных для корреляции, некоторые из них покажут корреляцию), или очень сложные механизмы, включающие несколько этапов.
Смотрите http://tylervigen.com/ для примеров, как это:
Чтобы уверенно утверждать, что причина A -> B, вам нужен эксперимент, в котором вы можете контролировать переменную A и не влиять на другие переменные. Затем вы измеряете, если корреляция A и B все еще существует, если вы измените свою переменную.
Почти во всех практических приложениях практически невозможно также не влиять на другие (часто неизвестные) переменные, поэтому лучшее, что мы можем сделать, - это доказать отсутствие причинности.
Чтобы иметь возможность сформулировать причинно-следственную связь, вы начинаете с гипотезы о том, что 2 переменные имеют причинно-следственную связь, используете эксперимент, чтобы опровергнуть гипотезу, и, если вы ошибаетесь, вы можете с определенной степенью уверенности утверждать, что гипотеза верна. Насколько высока степень вашей уверенности, зависит от вашей области исследований.
Во многих областях обычно или необходимо запускать две части эксперимента параллельно, одну, где изменяется переменная A, и контрольную группу, где переменная A не изменяется, но в остальном эксперимент точно такой же - например, в случае лекарство вы все равно засовываете предметы иглой или заставляете их глотать таблетки. Если эксперимент показывает корреляцию между A и B, но не между A и B '(B контрольной группы), вы можете предположить причинно-следственную связь.
Есть и другие способы сделать вывод о причинно-следственной связи, если эксперимент либо невозможен, либо нежелателен по различным причинам (мораль, этика, PR, стоимость, время). Одним из распространенных способов является использование вычета. Возьмем пример из комментария: чтобы доказать, что курение вызывает рак у людей, мы можем использовать эксперимент, чтобы доказать, что курение вызывает рак у мышей, а затем доказать, что существует взаимосвязь между курением и раком у людей, и сделать вывод, что, следовательно, это чрезвычайно Вероятно, что курение вызывает рак у людей - это доказательство может быть усилено, если мы также опровергаем, что рак вызывает курение. Другим способом сделать вывод о причинности является исключение других причин корреляции, оставляя причинность как лучшее оставшееся объяснение корреляции - этот метод не всегда применим, потому что иногда невозможно устранить все возможные причины корреляции (так называемые «задние пути» в другом ответе). В примере с курением / раком мы, вероятно, могли бы использовать этот подход, чтобы доказать, что курение несет ответственность за смолу в легких, потому что для этого не так много возможных источников.
Эти другие способы «доказательства» причинности не всегда идеальны с научной точки зрения, потому что они не так убедительны, как более простой эксперимент. Дискуссия о глобальном потеплении является отличным примером, показывающим, как намного легче отклонить причинно-следственную связь, которая еще не была окончательно доказана с помощью повторяемого эксперимента.
Для облегчения комиксов, вот пример эксперимента, который технически правдоподобен, но не рекомендуется из-за ненаучных причин (мораль, этика, PR, стоимость):