Вопросы с тегом «pca»

Анализ главных компонентов (PCA) - это метод линейного уменьшения размерности. Он сводит многомерный набор данных к меньшему набору построенных переменных, сохраняя как можно больше информации (как можно больше дисперсии). Эти переменные, называемые основными компонентами, являются линейными комбинациями входных переменных.

1
Каковы основные компоненты в исследованиях ассоциаций всего генома?
В общегеномных ассоциативных исследованиях (GWAS): Каковы основные компоненты? Почему они используются? Как они рассчитываются? Можно ли провести исследование ассоциации всего генома без использования PCA?
20 pca  genetics  gwas 

1
Геометрическое понимание СПС в предметном (двойственном) пространстве
Я пытаюсь получить интуитивное понимание того, как анализ главных компонентов (PCA) работает в предметном (двойном) пространстве . Рассмотрим двумерный набор данных с двумя переменными, x1x1x_1 и x2x2x_2 , и nnn точками данных (матрица данных XX\mathbf X имеет n×2n×2n\times 2 и предполагается, что она центрирована). Обычное представление PCA состоит в том, …

2
Как интерпретировать PCA на данных временных рядов?
Я пытаюсь понять использование PCA в недавней статье в журнале под названием «Отображение мозговой активности в масштабе с помощью кластерных вычислений» Freeman et al., 2014 (бесплатный pdf доступен на веб-сайте лаборатории ). Они используют PCA для данных временных рядов и используют веса PCA для создания карты мозга. Данные являются данными …

1
Нормализация данных до того, как PCA дает лучший объясненный коэффициент дисперсии
Я нормализовал свой набор данных, а затем провел трехкомпонентный PCA, чтобы получить малые объясненные коэффициенты дисперсии ([0,50, 0,1, 0,05]). Когда я не нормализовал, а отбелил набор данных, а затем провел трехкомпонентную PCA, я получил высокие объясненные коэффициенты дисперсии ([0,86, 0,06,0,01]). Поскольку я хочу сохранить как можно больше данных в 3 …
19 pca 

2
PCA и исследовательский факторный анализ по одному и тому же набору данных: различия и сходства; фактор-модель против PCA
Я хотел бы знать, имеет ли какой-либо логический смысл проводить анализ основных компонентов (PCA) и анализ факторных факторов (EFA) на одном и том же наборе данных. Я слышал, профессионалы прямо рекомендуют: Понять, какова цель анализа, и выбрать PCA или EFA для анализа данных; Сделав один анализ, нет необходимости делать другой …

3
Связь между регрессией гребня и регрессией PCA
Я помню, что где-то в Интернете читал связь между регрессией гребня (с регуляризацией ) и регрессией PCA: при использовании регрессии с с гиперпараметром , если , то регрессия эквивалентна удалению ПК переменная с наименьшим собственным значением.ℓ2ℓ2\ell_2 А , А , → 0ℓ2ℓ2\ell_2λλ\lambdaλ →0λ→0\lambda \to 0 Почему это правда? Это как-то …

1
Расположение стрелок на биплоте PCA
Я ищу, чтобы реализовать биплот для анализа основных компонентов (PCA) в JavaScript. Мой вопрос, как мне определить координаты стрелок из выходных данных сингулярного векторного разложения (SVD) матрицы данных?U,V,DU,В,DU,V,D Вот пример биплота R: biplot(prcomp(iris[,1:4])) Я попытался найти его в статье в Википедии о биплоте, но это не очень полезно. Или правильно. …
18 pca  svd  biplot 

1
Слепой источник разделения выпуклой смеси?
Предположим, у меня есть независимых источников, и я наблюдаю выпуклых смесей: Х 1 , Х 2 , . , , , X н м Y 1NNnИкс1, X2, . , , , XNИкс1,Икс2,,,,,ИксNX_1, X_2, ..., X_nммmY1, , ,Yм= а11Икс1+ а12Икс2+ ⋯ + a1 нИксN= ам 1Икс1+ ам 2Икс2+ ⋯ + aм …
18 pca  ica 

1
Как отбелить данные с помощью анализа основных компонентов?
Я хочу преобразовать свои данные так, чтобы отклонения были равны единице, а ковариации были равны нулю (т.е. я хочу отбелить данные). Кроме того, средства должны быть нулевыми.XX\mathbf X Я знаю, что доберусь туда, выполнив Z-стандартизацию и PCA-преобразование, но в каком порядке я должен их делать? Следует добавить, что составное отбеливающее …

1
Что именно называется «основным компонентом» в PCA?
Предположим есть вектор , который максимизирует дисперсию проекции данных с конструкцией матрицы .uuuXXX Теперь я видел материалы , которые относятся в качестве (первого) основного компонента данных, который также является собственным вектором с наибольшим собственным значением.uuu Однако я также видел, что основным компонентом данных является .XuXuX u Очевидно, и разные вещи. …

2
Компоненты с низкой дисперсией в PCA, действительно ли они просто шум? Есть ли способ проверить это?
Я пытаюсь решить, следует ли сохранить компонент PCA или нет. Существует множество критериев, основанных на величине собственного значения, которые описаны и сравнены, например, здесь или здесь . Однако в моем приложении я знаю, что малое (est) собственное значение будет небольшим по сравнению с большим (st) собственным значением, и критерии, основанные …
18 pca 

2
Какие четыре оси на биплоте PCA?
Когда вы строите биплот для анализа PCA, у вас есть оценки PC1 основного компонента по оси x и оценки PC2 по оси y. Но каковы две другие оси справа и сверху экрана?
18 r  pca  biplot 

1
Каковы преимущества ядра PCA перед стандартным PCA?
Я хочу реализовать алгоритм в статье, которая использует ядро ​​SVD для декомпозиции матрицы данных. Итак, я читал материалы о методах ядра, ядре PCA и т. Д. Но это все еще очень неясно для меня, особенно когда речь идет о математических деталях, и у меня есть несколько вопросов. Почему методы ядра? …
18 pca  svd  kernel-trick 

3
Почему мы делим на стандартное отклонение, а не какой-то другой фактор стандартизации, прежде чем делать PCA?
Я читал следующее обоснование (из заметок курса cs229) о том, почему мы делим необработанные данные на их стандартное отклонение: хотя я понимаю, что говорится в объяснении, мне не ясно, почему деление на стандартное отклонение приведет к такой цели. Это говорит о том, что все больше в одном и том же …

2
Взвешенный анализ основных компонентов
После некоторого поиска я обнаружил, что очень мало учитываю веса наблюдений / погрешности измерений в анализе основных компонентов. То, что я нахожу, имеет тенденцию полагаться на итеративные подходы для включения весов (например, здесь ). Мой вопрос: зачем нужен этот подход? Почему мы не можем использовать собственные векторы взвешенной ковариационной матрицы?

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.