Вопросы с тегом «assumptions»

Относится к условиям, при которых процедура статистики дает действительные оценки и / или выводы. Например, многие статистические методы требуют допущения, что данные каким-то образом выбираются случайным образом. Теоретические результаты об оценках обычно требуют предположений о механизме генерирования данных.

1
Почему не нормально распределенные ошибки ставят под угрозу достоверность наших утверждений о значимости?
При рассмотрении моделей OLS существует предположение о нормальности, а именно то, что ошибки распределяются нормально. Я просматривал Cross Validated, и кажется, что Y и X не должны быть нормальными, чтобы ошибки были нормальными. Мой вопрос заключается в том, почему, когда у нас есть ошибки, которые обычно не распределяются, действительность наших …

1
Исследование устойчивости логистической регрессии к нарушению линейности логита
Я провожу логистическую регрессию с бинарным исходом (старт и не старт). Все мои предикторы - это либо непрерывные, либо дихотомические переменные. Используя подход Бокса-Тидвелла, один из моих непрерывных предикторов потенциально нарушает предположение о линейности логита. В статистике соответствия качества нет никаких признаков того, что подбор проблематичен. Впоследствии я снова запустил …

2
Требуются ли порядковые или интервальные данные для теста с ранговым знаком Вилкоксона?
Посмотрев на несколько онлайн-источников, я не могу получить прямой ответ. Может ли кто-нибудь уточнить для меня, достаточно ли порядковых данных для использования в WSRT, и если нет, является ли проверка знака подходящей альтернативой? Наконец, это относится к моему диссертационному проекту в университете, и поэтому, если в ответы могут быть включены …

3
Допустимо ли иметь только два (или менее) элемента (переменных), загруженных фактором факторного анализа?
У меня есть набор из 20 переменных, которые я проанализировал с помощью факторного анализа в SPSS. Для целей исследования мне необходимо разработать 6 факторов. SPSS показал, что 8 переменных (из 20) были загружены с низким весом или были загружены одинаково по нескольким факторам, поэтому я удалил их. Оставшиеся 12 переменных …


1
Лечение выбросов, вызванных куртозом
Мне было интересно, может ли кто-нибудь помочь мне с информацией о куртозе (т.е. есть ли способ преобразовать ваши данные, чтобы уменьшить его?) У меня есть набор данных анкеты с большим количеством случаев и переменных. Для некоторых из моих переменных данные показывают довольно высокие значения эксцесса (то есть, распределение лептокуртов), что …

2
Проверка предположения о пропорциональной опасности в параметрических моделях
Мне известно о тестировании предположения о пропорциональной опасности в контексте моделей Кокса PH, но я не встречал ничего, связанного с параметрическими моделями? Есть ли реальный способ проверить предположение PH некоторых параметрических моделей? Кажется, что следует учитывать, что параметрические модели лишь немного отличаются от полупараметрических моделей Кокса? Например, если бы я …

1
R линейная регрессия категориальной переменной «скрытое» значение
Это всего лишь пример, с которым я сталкивался несколько раз, поэтому у меня нет примеров данных. Запуск модели линейной регрессии в R: a.lm = lm(Y ~ x1 + x2) x1является непрерывной переменной x2является категориальным и имеет три значения, например, «Низкий», «Средний» и «Высокий». Однако вывод, заданный R, будет выглядеть примерно …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

2
Предположения наименьших квадратов
Предположим следующую линейную зависимость: , где - зависимая переменная, - одна независимая переменная, а - термин ошибки.Y i X i u iYi=β0+β1Xi+uiYi=β0+β1Xi+uiY_i = \beta_0 + \beta_1 X_i + u_iYiYiY_iXiXiX_iuiuiu_i Согласно Stock & Watson (Введение в эконометрику; глава 4 ), третье предположение о наименьших квадратах состоит в том, что четвертые моменты …

3
Каковы последствия наличия непостоянной дисперсии в терминах ошибки в линейной регрессии?
Одно из предположений о линейной регрессии состоит в том, что должна быть постоянная дисперсия в терминах ошибок и что доверительные интервалы и проверки гипотез, связанные с моделью, основаны на этом предположении. Что именно происходит, когда члены ошибки не имеют постоянной дисперсии?

1
Когда можно написать «мы предположили нормальное распределение» эмпирического измерения?
В преподавании прикладных дисциплин, таких как медицина, заложено, что измерения биомедицинских величин в популяции следуют нормальной «кривой колокола». Поиск из Google в строке «мы предполагали , нормальное распределение» возвращает результатов! Они звучат так: «учитывая небольшое количество экстремальных точек данных, мы предполагали нормальное распределение температурных аномалий» в исследовании изменения климата; или …

2
В чем разница между этими двумя тестами Бреуша-язычества?
Используя R на некоторых данных и пытаясь определить , являются ли мои данные гетероскедастичными, я нашел две реализации теста Бреуша -Пагана: bptest (package lmtest) и ncvTest (package car). Однако они дают разные результаты. Какая разница между двумя? Когда вы должны использовать один или другой? > model <- lm(y ~ x) …

1
Вопрос о предположении нормальности t-критерия
Для t-тестов, согласно большинству текстов, есть предположение, что данные о населении обычно распределяются. Я не понимаю, почему это так. Разве t-критерий не требует только того, чтобы распределение выборки средних значений выборки было нормально распределено, а не совокупность? Если это так, что критерий Стьюдента в конечном итоге требует только нормальности в …

2
Как остатки связаны с основными нарушениями?
В методе наименьших квадратов мы хотим оценить неизвестные параметры в модели: YJ= α + βИксJ+ εJ( j = 1 ... n )YJзнак равноα+βИксJ+εJ(Jзнак равно1 ...N)Y_j = \alpha + \beta x_j + \varepsilon_j \enspace (j=1...n) Как только мы это сделаем (для некоторых наблюдаемых значений), мы получим подогнанную линию регрессии: YJ= α^+ …

2
Проверка предположения о пропорциональных шансах выполняется в порядковой логистической регрессии с использованием функции polr
Я использовал функцию 'polr' в пакете MASS, чтобы запустить порядковую логистическую регрессию для порядковой категориальной переменной ответа с 15 непрерывными объясняющими переменными. Я использовал код (показанный ниже), чтобы проверить, что моя модель соответствует предположению о пропорциональных шансах, следуя советам, приведенным в руководстве UCLA . Тем не менее, я немного беспокоюсь …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.