Читая Википедию о каноническом корреляционном анализе (CCA) для двух случайных векторов и , мне стало интересно, совпадает ли анализ основных компонентов (PCA) с CCA, когда ?Y X = Y
Читая Википедию о каноническом корреляционном анализе (CCA) для двух случайных векторов и , мне стало интересно, совпадает ли анализ основных компонентов (PCA) с CCA, когда ?Y X = Y
Ответы:
Пусть будет и будет матриц данных, представляющих два набора данных с выборками (то есть наблюдениями ваших случайных векторов строк и ) в каждой из них.
CCA ищет линейную комбинацию переменных в и линейную комбинацию переменных в , чтобы они максимально коррелировали между собой; затем он ищет следующую пару при условии нулевой корреляции с первой парой; и т.п.
В случае (и ) любая линейная комбинация в одном наборе данных будет тривиально иметь корреляцию с той же линейной комбинацией в другом наборе данных. Таким образом, все пары CCA будут иметь корреляции , а порядок пар произвольный. Единственное оставшееся ограничение - линейные комбинации должны быть некоррелированными между собой. Существует бесконечное количество способов выбора некоррелированных линейных комбинаций (обратите внимание, что веса не должны быть ортогональными в -мерном пространстве), и любой из них даст правильное решение CCA. PCA действительно дает один такой способ, поскольку любые два ПК имеют нулевую корреляцию.
Таким образом, решение PCA действительно будет действительным решением CCA, но в этом случае существует бесконечное количество одинаково хороших решений CCA.
Математически CCA ищет правые ( ) и левые ( ) сингулярные векторы , которая в этом случае равна , причем любой вектор является собственным вектором. Так что может быть произвольным. Затем CCA получает веса линейной комбинации как и . В этом случае он сводится к тому, чтобы взять произвольный базис и преобразовать его с помощью , который действительно будет давать некоррелированные направления .б С - 1 / 2 Х Х С Х У С - 1 / 2 У У меня = Ь С - 1 / 2 Х Х С - 1 / 2 Y Y B C - 1 / 2 Х Х
vectors X and Y
это две переменные (столбцы данных) или два падежа (строки); учитывая, что мы собираемся выполнить анализ переменных. 2)X and Y are the same
Вы хотели сказать, что X = Y или как-то иначе?