Вопросы с тегом «data-transformation»

Математическое переопределение, часто нелинейное, значений данных. Данные часто преобразуются либо для соответствия допущениям статистической модели, либо для того, чтобы сделать результаты анализа более понятными.

2
Преобразование данных пропорции: когда квадратного корня арксинуса недостаточно
Есть ли (более сильная?) Альтернатива квадратному корню арксин для преобразования процент / пропорция? В наборе данных, над которым я сейчас работаю, заметная гетероскедастичность сохраняется после того, как я применяю это преобразование, то есть график зависимости остатков от подгоночных значений все еще очень ромбовидный. Отредактировано, чтобы отвечать на комментарии: данные представляют …

4
Каковы правильные значения для точности и отзыва в крайних случаях?
Точность определяется как: p = true positives / (true positives + false positives) Является ли это исправить , что, как true positivesи false positivesподход 0, точность приближается к 1? Тот же вопрос для отзыва: r = true positives / (true positives + false negatives) В настоящее время я выполняю статистический …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

2
От равномерного распределения к экспоненциальному распределению и наоборот
Вероятно , это тривиальный вопрос, но мой поиск был бесплодном до сих пор, в том числе этой статьи в Википедии , и «Compendium распределений» документ . Если имеет равномерное распределение, означает ли это, что следует экспоненциальному распределению?e XXXXeXeXe^X Аналогично, если следует экспоненциальному распределению, означает ли это, что следует равномерному распределению?l …

2
Расчет стандартной ошибки после лог-преобразования
Рассмотрим случайный набор чисел, которые обычно распределяются: x <- rnorm(n=1000, mean=10) Нам бы хотелось знать среднее и стандартную ошибку на среднем, поэтому мы делаем следующее: se <- function(x) { sd(x)/sqrt(length(x)) } mean(x) # something near 10.0 units se(x) # something near 0.03 units Большой! Однако, давайте предположим, что мы не …

2
Является ли преобразование журнала допустимым методом для t-тестирования ненормальных данных?
В рецензии на статью авторы утверждают: «Непрерывные переменные результата, демонстрирующие искаженное распределение, были преобразованы с использованием натуральных логарифмов перед проведением t-тестов для удовлетворения предварительных условий нормальности». Является ли это приемлемым способом анализа нестандартных данных, особенно если базовое распределение не обязательно является логнормальным? Это может быть очень глупый вопрос, но я …

3
Как выполнить изометрическое логарифмическое преобразование
У меня есть данные о поведении при движении (время, проведенное во сне, сидячий образ жизни и выполнение физических упражнений), которое составляет приблизительно 24 (как в часах в день). Я хочу создать переменную, которая фиксирует относительное время, затрачиваемое на каждое из этих поведений, - мне сказали, что изометрическое преобразование логарифмического соотношения …

5
По какой причине преобразование журналов используется с искаженными дистрибутивами?
Я однажды слышал, что логарифмическое преобразование является наиболее популярным для правосторонних распределений в линейной регрессии или квантильной регрессии Я хотел бы знать, есть ли причина, лежащая в основе этого утверждения? Почему преобразование журналов подходит для правильного распределения? Как насчет левостороннего распределения?

3
Что означает «нормализация» и как проверить, что выборка или распределение нормализованы?
У меня есть вопрос, в котором он просит проверить, нормализовано ли равномерное распределение ( Uniform(a,b)Uniform(a,b){\rm Uniform}(a,b) ). С одной стороны, что означает для любого распределения быть нормализованным? И второе: как нам проверить, нормализовано ли распределение? Я понимаю, вычисляя X−meansdX−meansd \frac{X-\text{mean}}{\text{sd}} мы получаем нормализованныеданные, но здесь мы просим проверить,нормализованолираспределение.

2
Сравнение AIC модели и ее лог-преобразованной версии
Суть моего вопроса заключается в следующем: Пусть Y∈RnY∈RnY \in \mathbb{R}^n быть многомерной нормальной случайной величиной со средним и ковариационной матрицей . Пусть , то есть . Как сравнить AIC модели, подходящей для наблюдаемых реализаций с моделью, подходящей для наблюдаемых реализаций Z ?μμ\muΣΣ\SigmaZ:=log(Y)Z:=log⁡(Y)Z := \log(Y)Zi=log(Yi),i∈{1,…,n}Zi=log⁡(Yi),i∈{1,…,n}Z_i = \log(Y_i), i \in \{1,\ldots,n\}YYYZZZ Мой …

4
«Нормализующие» переменные для SVD / PCA
Предположим, у нас есть NNN измеримых переменных (a1,a2,…,aN)(a1,a2,...,aN)(a_1, a_2, \ldots, a_N) , мы выполняем ряд измерений M>NM>NM > N , а затем хотим выполнить разложение по сингулярным значениям результатов, чтобы найти оси наибольшей дисперсии для MMM точек в NNN мерном пространстве. ( Примечание: предположим , что средства я уже вычитали, …

2
Обратное преобразование коэффициентов регрессии
Я делаю линейную регрессию с преобразованной зависимой переменной. Следующее преобразование было сделано для того, чтобы предположение о нормальности остатков было выполнено. Нетрансформированная зависимая переменная была отрицательно искажена, и следующее преобразование приблизило ее к нормальному: Y=50−Yorig−−−−−−−−√Y=50−YorigY=\sqrt{50-Y_{orig}} где YorigYorigY_{orig} является зависимой переменной в исходном масштабе. Я думаю, что имеет смысл использовать некоторое …

2
Зачем преобразовывать данные в журнал перед выполнением анализа главных компонентов?
Я следую учебному пособию здесь: http://www.r-bloggers.com/computing-and-visualizing-pca-in-r/, чтобы лучше понять PCA. Учебное пособие использует набор данных Iris и применяет преобразование журнала до PCA: Обратите внимание, что в следующем коде мы применяем логарифмическое преобразование к непрерывным переменным, как предложено в [1], и устанавливаем centerи scaleравняемся TRUEпри вызове prcompдля стандартизации переменных до применения …

2
Почему GLM отличается от LM с преобразованной переменной
Как поясняется в раздаточном материале этого курса (стр. 1) , линейная модель может быть записана в виде: y=β1x1+⋯+βpxp+εi,y=β1x1+⋯+βpxp+εi, y = \beta_1 x_{1} + \cdots + \beta_p x_{p} + \varepsilon_i, где - переменная ответа, а - пояснительная переменная .yyyxixix_{i}ithithi^{th} Часто с целью удовлетворения предположений теста можно преобразовать переменную ответа. Например, мы …

2
Вывод нормализующего преобразования для GLM
\newcommand{\E}{\mathbb{E}} Как нормализует преобразование A ( ⋅ ) = ∫ d uВ 1 / 3 ( μ )A(⋅)=∫duV1/3(μ)A(\cdot) = \displaystyle\int\frac{du}{V^{1/3}(\mu)} для экспоненциального семейства получен? Более конкретно : я пытался следовать расширительному эскизу Тэйлор на странице 3, слайд- здесь , но есть несколько вопросов. С ИксXX из экспоненциального семейства, преобразованием ч …

4
Подводные камни, которых следует избегать при преобразовании данных?
Я добился прочной линейной взаимосвязи между моей переменной XXX и YYY после двукратного преобразования ответа. Модель была Y∼XY∼XY\sim X но я преобразовал ее в YX−−√∼X−−√YX∼X\sqrt{\frac{Y}{X}}\sim \sqrt{X} улучшилR2R2R^2с .19 до .76. Очевидно, я сделал приличную операцию на этих отношениях. Может ли кто-нибудь обсудить подводные камни, связанные с этим, такие как опасность …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.