Вопросы с тегом «data-transformation»

Математическое переопределение, часто нелинейное, значений данных. Данные часто преобразуются либо для соответствия допущениям статистической модели, либо для того, чтобы сделать результаты анализа более понятными.

4
Использование децибел в статистике
Я работаю над проектом, который включает чтение меток RFID и сравнение уровня сигнала, который читатель видит при изменении конфигурации антенны (количество антенн, положение и т. Д.). Как часть проекта, мне нужно сравнить настройки, чтобы увидеть, какие из них наиболее эффективны. В идеале я мог бы выполнить либо непарный t-тест, либо …

2
Тест Бартлетта против теста Левена
В настоящее время я пытаюсь устранить нарушения в предположениях ANOVA. Я использовал Шапиро-Уилка для проверки нормальности и баловался как с тестом Левена, так и с тестом Бартлетта на дисперсионное равенство. С тех пор журнал преобразовал мои данные, чтобы попытаться исправить неравные отклонения. Я перезапустил тест Бартлетта на преобразованных логарифмических данных, …

1
Сравните соответствия модели с преобразованным и нетрансформированным ответом
Я хочу сравнить данные, которые пропорции между тремя различными группами, например: ID Group Prop.Nitrogen 1 A 0.89 2 A 0.85 3 B 0.92 4 B 0.97 Вслед за Уортоном и Хуэем (doi: 10.1890 / 10-0340.1 1 ) я подумал, что лучше посмотреть, будут ли эти данные лучше обрабатывать с использованием …

3
Являются ли эти формулы для преобразования P, LSD, MSD, HSD, CI в SE точной или завышенной / консервативной оценкой ?
Фон Я провожу метаанализ, который включает ранее опубликованные данные. Часто о различиях между обработками сообщают с помощью значений Р, наименее значимых различий (ЛСД) и других статистических данных, но они не дают прямой оценки дисперсии. В контексте модели, которую я использую, переоценка дисперсии в порядке. проблема Вот список преобразований в где …

3
Преобразование, чтобы изменить перекос, не влияя на эксцесс?
Мне любопытно, есть ли преобразование, которое изменяет перекос случайной величины, не влияя на эксцесс. Это было бы аналогично тому, как аффинное преобразование RV влияет на среднее значение и дисперсию, но не на перекос и эксцесс (отчасти потому, что перекос и эксцесс определяется как инвариантный к изменениям масштаба). Это известная проблема?

1
Обратно преобразованные доверительные интервалы
Столкнувшись с этим обсуждением, я поднимаю вопрос о конвенциях с обратным преобразованием доверительных интервалов. В соответствии с этой статьей номинальное покрытие обратного преобразования КИ для среднего значения логнормальной случайной величины составляет: UCL(X)=exp(Y+var(Y)2+zvar(Y)n+var(Y)22(n−1)−−−−−−−−−−−−√) UCL(X)=exp⁡(Y+var(Y)2+zvar(Y)n+var(Y)22(n−1))\ UCL(X)= \exp\left(Y+\frac{\text{var}(Y)}{2}+z\sqrt{\frac{\text{var}(Y)}{n}+\frac{\text{var}(Y)^2}{2(n-1)}}\right) LCL(X)=exp(Y+var(Y)2−zvar(Y)n+var(Y)22(n−1)−−−−−−−−−−−−√) LCL(X)=exp⁡(Y+var(Y)2−zvar(Y)n+var(Y)22(n−1))\ LCL(X)= \exp\left(Y+\frac{\text{var}(Y)}{2}-z\sqrt{\frac{\text{var}(Y)}{n}+\frac{\text{var}(Y)^2}{2(n-1)}}\right) / а не наивный /exp((Y)+zvar(Y)−−−−−−√)exp⁡((Y)+zvar(Y))\exp((Y)+z\sqrt{\text{var}(Y)}) Теперь, что такое такие КИ для …

1
Работа с регрессией необычно ограниченной переменной ответа
Я пытаюсь смоделировать переменную ответа, теоретически ограниченную между -225 и +225. Переменная - это общая оценка, которую субъекты получают, играя в игру. Хотя теоретически это возможно для предметов +225. Несмотря на это, потому что счет зависел не только от действий субъектов, но и от действий других действий, максимум, который набрал …

2
Преобразование непрерывных переменных для логистической регрессии
У меня есть большие данные опроса, двоичная переменная результата и много объясняющих переменных, включая двоичные и непрерывные. Я строю наборы моделей (экспериментирую как с GLM, так и со смешанным GLM) и использую теоретико-информационные подходы для выбора топ-модели. Я тщательно изучил объяснения (как непрерывные, так и категориальные) на предмет корреляций, и …

2
Проблема преобразования из фактора в числовую переменную в R [закрыто]
Закрыто. Этот вопрос не по теме . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто 7 лет назад . Я хотел бы преобразовать факторную переменную в числовую, но as.numericне имеет ожидаемого эффекта. Ниже я получаю сводную статистику для …

2
Кластеризация очень искаженных, подсчитываемых данных: есть ли какие-либо предложения (трансформировать и т.д.)
Основная проблема Вот моя основная проблема: я пытаюсь кластеризовать набор данных, содержащий некоторые очень искаженные переменные со счетчиками. Переменные содержат много нулей и поэтому не очень информативны для моей процедуры кластеризации, которая, вероятно, будет алгоритмом k-средних. Хорошо, вы говорите, просто преобразуйте переменные, используя квадратный корень, блок-кокс или логарифм. Но так …

4
Почему бы не преобразовать в лог все переменные, которые не представляют основного интереса?
В книгах и дискуссиях часто утверждается, что при возникновении проблем (из которых есть несколько) с предиктором, log-transformimg это возможно. Теперь я понимаю, что это зависит от распределений, и нормальность в предикторах не является предположением о регрессии; но преобразование журнала делает данные более однородными, меньше подверженными выбросам и так далее. Я …

2
Регрессия с обратной независимой переменной
Предположим, у меня есть вектор зависимых переменных и вектор независимой переменной. Когда отображается на графике , я вижу, что между ними существует линейная зависимость (восходящая тенденция). Теперь это также означает, что между и существует линейная тенденция к снижению .NNNYYYNNNXXXYYY1X1X\frac{1}{X}YYYXXX Теперь, если я запускаю регрессию: и получаю подходящее значениеY=β∗X+ϵY=β∗X+ϵY = \beta …

3
Как повторное взвешивание данных о разнообразии Американского Сообщества повлияет на погрешность?
Справочная информация. В настоящее время моя организация сравнивает свои статистические данные о разнообразии рабочей силы (например,% инвалидов,% женщин,% ветеранов) с общей доступностью рабочей силы для этих групп на основе обследования американского сообщества (проект обследования Бюро переписи населения США). Это неточный ориентир, потому что у нас очень специфический набор рабочих мест, …

1
Как мне включить инновационный выброс при наблюдении 48 в мою модель ARIMA?
Я работаю над набором данных. После использования некоторых методов идентификации моделей я разработал модель ARIMA (0,2,1). Я использовал detectIOфункцию в пакете TSAв R, чтобы обнаружить инновационный выброс (IO) на 48-м наблюдении за моим исходным набором данных. Как включить этот выброс в мою модель, чтобы я мог использовать его для целей …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

1
Я регистрирую преобразованную зависимую переменную, могу ли я использовать нормальное распределение GLM с функцией ссылки LOG?
У меня есть вопрос, касающийся обобщенных линейных моделей (GLM). Моя зависимая переменная (DV) непрерывна и не является нормальной. Таким образом, я лог преобразовал это (все еще не нормальный, но улучшил это). Я хочу связать DV с двумя категориальными переменными и одной непрерывной ковариабельной. Для этого я хочу провести GLM (я …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.