Есть три случайные величины, . Три корреляции между тремя переменными одинаковы. То есть,
Какую самую тесную границу вы можете дать для ?
Есть три случайные величины, . Три корреляции между тремя переменными одинаковы. То есть,
Какую самую тесную границу вы можете дать для ?
Ответы:
Общая корреляция может иметь значение но не . Если , то не может быть равно но фактически равно . Наименьшее значение общей корреляции трех случайных величин равно . В более общем смысле, минимальная общая корреляция случайных величин равна когда они рассматриваются как векторы и находятся в вершинах симплекса (размерности ) в мерном пространстве.+ 1 - 1 ρ X , Y = ρ X , Z = - 1 ρ Y , Z - 1 + 1 - 1 n-1 n-1n
Рассмотрим дисперсию суммы единиц дисперсии случайных величин . У нас есть где - среднее значение значение из коэффициентов корреляции. Но поскольку , мы легко получаем из что X i var ( n ∑ i = 1 X i ) ˉ ρ
Таким образом, среднее значение коэффициента корреляции не менее . Если все коэффициенты корреляции имеют одинаковое значение , то их среднее значение также равно и поэтому мы имеем это Можно ли иметь случайные величины, для которых общее значение корреляции равно ? Да. Предположим, что являются некоррелированными случайными переменными единичной дисперсии и . Тогда , а ρρρ≥-1ρ-1
Максимально возможная граница . Все такие значения действительно могут появиться - ни одно не является невозможным.
Чтобы показать, что в результате нет ничего особенно глубокого или загадочного, этот ответ сначала представляет собой полностью элементарное решение, требующее только очевидного факта, что отклонения, являющиеся ожидаемыми значениями квадратов, должны быть неотрицательными. За этим следует общее решение (в котором используются немного более сложные алгебраические факты).
Дисперсия любой линейной комбинации должна быть неотрицательной. Пусть дисперсия этих переменных равна и соответственно. Все они ненулевые (иначе некоторые корреляции не будут определены). Используя основные свойства дисперсий, мы можем вычислить
для всех действительных чисел .
Предполагая , небольшая алгебраическая манипуляция подразумевает, что это эквивалентно
Квадрат в правой части - это отношение двух степенных средних . Элементарная мощность среднего неравенства (с весами ) утверждает , что отношение не может превышать (и будет равно , когда ). Немного больше алгебры тогда подразумевает
Ниже приведен явный пример (с использованием тривиальных нормальных переменных ), который показывает, что все такие значения, , действительно возникают как корреляции. Этот пример использует только определение многомерных нормалей, но в противном случае не вызывает результатов исчисления или линейной алгебры.
Любая корреляционная матрица является ковариационной матрицей стандартизированных случайных величин, поэтому, как и все корреляционные матрицы, она должна быть положительной полуопределенной. Эквивалентно, его собственные значения неотрицательны. Это накладывает простое условие на : оно не должно быть меньше (и, конечно, не может превышать ). Наоборот, любой такой самом деле соответствует корреляционной матрице некоторого тривариатного распределения, доказывая, что эти границы являются максимально тесными.
Рассмотрим корреляционную матрицу by со всеми недиагональными значениями, равными(Вопрос касается случая но это обобщение более не сложно анализировать.) Назовем его По определению, является собственным значением, если существует ненулевой вектор такой, что
Эти собственные значения легко найти в данном случае, потому что
Пусть , вычислим, что
Обозначение с только в месте (для ), вычислите это
Поскольку найденные собственных векторов охватывают полное мерное пространство (доказательство: простое сокращение строк показывает абсолютное значение их определителя, равное , которое отлично от нуля), они составляют основу всех собственных векторов. Поэтому мы нашли все собственные значения и определили, что они либо либо (последнее с кратностью ). В дополнение к общеизвестному неравенству которому удовлетворяют все корреляции, неотрицательность первого собственного значения также подразумевает
в то время как неотрицательность второго собственного значения не накладывает новых условий.
Последствия работают в обоих направлениях: при условии, что матрица неотрицательно определена и, следовательно, является допустимой корреляционной матрицей. Это, например, корреляционная матрица для мультинормального распределения. Конкретно напиши
для обратного когда Например, когда
Пусть вектор случайных величин имеет функцию распределения
где . Например, когда это равно
Матрица корреляции для этих случайных величин равна
Контуры функций плотности Слева направо, . Обратите внимание, как плотность смещается от концентрации вблизи плоскости к концентрации вблизи линии .
Частные случаи и также могут быть реализованы вырожденными распределениями; Я не буду вдаваться в подробности, за исключением того, что хочу указать, что в первом случае распределение можно считать поддерживаемым на гиперплоскости , где это сумма идентично распределенных средних значений Нормальное распределение, тогда как в последнем случае (идеальная положительная корреляция) оно поддерживается в строке, генерируемой , где оно имеет среднее значение - Нормальное распределение.
Обзор этого анализа показывает, что корреляционная матрица имеет ранг а имеет ранг из (потому что только один собственный вектор имеет ненулевое собственное значение). При это делает матрицу корреляции вырожденной в любом случае. В противном случае существование его обратной доказывает, что оно невырождено.
Ваша корреляционная матрица
Матрица положительно полуопределена, если все главные старшие миноры неотрицательны. Основными минорами являются детерминанты «северо-западных» блоков матрицы, т. Е. 1, детерминант
и определитель самой корреляционной матрицы.
1, очевидно, является положительным, второй главный минор - , который неотрицателен для любой допустимой корреляции . Определитель всей корреляционной матрицы
График показывает определитель функции в диапазоне допустимых корреляций .
Вы видите, что функция неотрицательна в диапазоне, заданном @stochazesthai (который вы также можете проверить, найдя корни детерминантного уравнения).
Существуют случайные величины , и с попарными корреляциями тогда и только тогда, когда корреляционная матрица является положительной полуопределенной. Это происходит только для .Y Z ρ X Y = ρ Y Z = ρ X Z = ρ ρ ∈ [ - 1