Я пытался лучше понять Ковариацию двух случайных переменных и понять, как первый человек, который об этом подумал, пришел к определению, которое обычно используется в статистике. Я пошел в Википедию, чтобы понять это лучше. Из статьи видно, что хороший показатель-кандидат или величина для должны обладать следующими свойствами:
- Он должен иметь положительный знак, когда две случайные переменные похожи (то есть, когда одна увеличивается, другая увеличивается, а когда одна уменьшается, другая тоже).
- Мы также хотим, чтобы он имел отрицательный знак, когда две случайные переменные противоположно похожи (т.е. когда одна увеличивается, другая случайная переменная имеет тенденцию к уменьшению)
- Наконец, мы хотим, чтобы эта ковариационная величина была равна нулю (или, возможно, чрезвычайно мала?), Когда две переменные не зависят друг от друга (т.е. они не изменяются по отношению друг к другу).
Из приведенных выше свойств мы хотим определить . Мой первый вопрос: мне не совсем понятно, почему удовлетворяет этим свойствам. От свойств, которые мы имеем, я ожидал бы, что больше подобного производному уравнения будет идеальным кандидатом. Например, что-то вроде «если изменение в X положительное, то изменение в Y также должно быть положительным». Кроме того, почему «правильная» вещь делает разницу от среднего?
Более касательный, но все же интересный вопрос: есть ли другое определение, которое могло бы удовлетворить эти свойства и было бы значимым и полезным? Я спрашиваю об этом, потому что, кажется, никто не задается вопросом, почему мы используем это определение в первую очередь (кажется, что оно «всегда было таким», что, на мой взгляд, является ужасной причиной и мешает научным и математическое любопытство и мышление). Является ли принятое определение «лучшим» определением, которое мы могли бы иметь?
Вот мои мысли о том, почему принятое определение имеет смысл (оно будет только интуитивным аргументом):
Позвольте быть некоторой разницей для переменной X (то есть она изменилась от некоторого значения к некоторому другому значению через некоторое время). Аналогично для определения .
Для одного случая во времени мы можем вычислить, связаны ли они или нет, выполнив:
Это несколько мило! Для одного случая во времени он удовлетворяет свойствам, которые мы хотим. Если они оба увеличиваются вместе, то в большинстве случаев вышеуказанное количество должно быть положительным (и, аналогично, когда они противоположно похожи, оно будет отрицательным, поскольку будет иметь противоположные знаки).
Но это только дает нам количество, которое мы хотим для одного экземпляра во времени, и, поскольку они являются rv, мы могли бы переопределить их, если бы решили основать отношение двух переменных на основе только одного наблюдения. Тогда почему бы не принять это ожидание, чтобы увидеть «средний» продукт различий.
Что в среднем должно отражать средние отношения, как определено выше! Но единственная проблема этого объяснения состоит в том, чем мы измеряем эту разницу? Что, кажется, решается путем измерения этой разницы от среднего значения (что по какой-то причине является правильным решением).
Я предполагаю, что главная проблема, которую я имею с определением, принимает разницу от среднего значения . Я пока не могу оправдать это для себя.
Интерпретация знака может быть оставлена для другого вопроса, так как это, кажется, более сложная тема.