Вопросы с тегом «compositional-data»

3
Как выполнить изометрическое логарифмическое преобразование
У меня есть данные о поведении при движении (время, проведенное во сне, сидячий образ жизни и выполнение физических упражнений), которое составляет приблизительно 24 (как в часах в день). Я хочу создать переменную, которая фиксирует относительное время, затрачиваемое на каждое из этих поведений, - мне сказали, что изометрическое преобразование логарифмического соотношения …

1
Каковы некоторые распределения по вероятностному симплексу?
Пусть - вероятностный симплекс размерности K - 1 , т. Е. X ∈ Δ K таково, что x i ≥ 0 и ∑ i x i = 1 .ΔKΔK\Delta_{K}K−1K−1K-1x∈ΔKx∈ΔKx \in \Delta_{K}xi≥0xi≥0x_i \ge 0∑ixi=1∑ixi=1\sum_i x_i = 1 Какие дистрибутивы , которые часто (или хорошо известны, или определенные в прошлом) над существует?ΔKΔK\Delta_{K} …

2
Могу ли я использовать CLR (центрированное преобразование логарифмического отношения) для подготовки данных для PCA?
Я использую скрипт. Это для основных записей. У меня есть датафрейм, который показывает различные элементные композиции в столбцах на заданной глубине (в первом столбце). Я хочу провести с ним PCA, и меня не устраивает метод стандартизации, который я должен выбрать. Кто-нибудь из вас использовал clr()данные для подготовки prcomp()? Или это …

3
Нужно ли отбрасывать переменные, которые коррелированы / коллинеарны перед запуском kmeans?
Я использую kmeans для определения групп клиентов. У меня есть около 100 переменных для определения кластеров. Каждая из этих переменных представляет собой процент расходов клиента на категорию. Итак, если у меня есть 100 категорий, у меня есть эти 100 переменных, так что сумма этих переменных составляет 100% для каждого клиента. …

2
Кластеризация очень искаженных, подсчитываемых данных: есть ли какие-либо предложения (трансформировать и т.д.)
Основная проблема Вот моя основная проблема: я пытаюсь кластеризовать набор данных, содержащий некоторые очень искаженные переменные со счетчиками. Переменные содержат много нулей и поэтому не очень информативны для моей процедуры кластеризации, которая, вероятно, будет алгоритмом k-средних. Хорошо, вы говорите, просто преобразуйте переменные, используя квадратный корень, блок-кокс или логарифм. Но так …

4
Почему нельзя делать корреляцию Пирсона по данным о пропорциях?
Онлайн модуль, который я изучаю, утверждает, что никогда не следует использовать корреляцию Пирсона с данными о пропорциях. Почему бы нет? Или, если это иногда хорошо или всегда хорошо, почему?

4
Какой тест для сравнения состава сообщества?
Надеюсь, что этот вопрос новичка является правильным вопросом для этого сайта: Предположим, я хотел бы сравнить состав экологических сообществ на двух участках A, B. Я знаю, что на всех трех участках есть собаки, кошки, коровы и птицы, поэтому я проверяю их численность на каждом участке (на самом деле у меня …
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.