Осторожно ... только то, что ПК по своей конструкции ортогональны друг другу, не означает, что здесь нет шаблона или что один ПК не может «объяснить» что-то о других ПК.
Рассмотрим трехмерные данные (X, Y, Z), описывающие большое количество точек, равномерно распределенных по поверхности американского футбола (это эллипсоид, а не сфера для тех, кто никогда не смотрел американский футбол). Представьте, что футбол находится в произвольной конфигурации, так что ни X, ни Y, ни Z не находятся вдоль длинной оси футбола.
Главные компоненты разместят PC1 вдоль длинной оси футбола, оси, которая описывает наибольшую дисперсию в данных.
Для любой точки в измерении PC1 вдоль длинной оси футбола плоский срез, представленный PC2 и PC3, должен описывать окружность, а радиус этого кругового среза зависит от размера PC1. Это правда, что регрессия ПК2 или ПК3 на ПК1 должна давать нулевой коэффициент в глобальном масштабе, но не на меньших участках футбола ... и ясно, что 2D-график ПК1 и ПК2 будет показывать "интересную" ограничивающую границу это двухзначное, нелинейное и симметричное.
rтег и что вы подразумеваете под «почему это так»? ПК не коррелированы, то есть они ортогональны, аддитивны, вы не можете предсказать один ПК с другим. Вы ищете формулу?