Статистика и большие данные assumptions

1

Почему не нормально распределенные ошибки ставят под угрозу достоверность наших утверждений о значимости?

При рассмотрении моделей OLS существует предположение о нормальности, а именно то, что ошибки распределяются нормально. Я просматривал Cross Validated, и кажется, что Y и X не должны быть нормальными, чтобы ошибки были нормальными. Мой вопрос заключается в том, почему, когда у нас есть ошибки, которые обычно не распределяются, действительность наших …

10 regression statistical-significance assumptions normality-assumption

1

Исследование устойчивости логистической регрессии к нарушению линейности логита

Я провожу логистическую регрессию с бинарным исходом (старт и не старт). Все мои предикторы - это либо непрерывные, либо дихотомические переменные. Используя подход Бокса-Тидвелла, один из моих непрерывных предикторов потенциально нарушает предположение о линейности логита. В статистике соответствия качества нет никаких признаков того, что подбор проблематичен. Впоследствии я снова запустил …

10 regression logistic references assumptions robust

2

Требуются ли порядковые или интервальные данные для теста с ранговым знаком Вилкоксона?

Посмотрев на несколько онлайн-источников, я не могу получить прямой ответ. Может ли кто-нибудь уточнить для меня, достаточно ли порядковых данных для использования в WSRT, и если нет, является ли проверка знака подходящей альтернативой? Наконец, это относится к моему диссертационному проекту в университете, и поэтому, если в ответы могут быть включены …

10 nonparametric assumptions wilcoxon-signed-rank

3

Допустимо ли иметь только два (или менее) элемента (переменных), загруженных фактором факторного анализа?

У меня есть набор из 20 переменных, которые я проанализировал с помощью факторного анализа в SPSS. Для целей исследования мне необходимо разработать 6 факторов. SPSS показал, что 8 переменных (из 20) были загружены с низким весом или были загружены одинаково по нескольким факторам, поэтому я удалил их. Оставшиеся 12 переменных …

10 spss factor-analysis references assumptions

3

Полиномиальные предположения логистической регрессии

Каковы правильные предположения о полиномиальной логистической регрессии? И какие тесты лучше всего подходят для этих предположений с использованием SPSS 18?

10 logistic spss assumptions multinomial multinomial-logit

1

Лечение выбросов, вызванных куртозом

Мне было интересно, может ли кто-нибудь помочь мне с информацией о куртозе (т.е. есть ли способ преобразовать ваши данные, чтобы уменьшить его?) У меня есть набор данных анкеты с большим количеством случаев и переменных. Для некоторых из моих переменных данные показывают довольно высокие значения эксцесса (то есть, распределение лептокуртов), что …

10 distributions assumptions kurtosis discriminant-analysis parametric

2

Проверка предположения о пропорциональной опасности в параметрических моделях

Мне известно о тестировании предположения о пропорциональной опасности в контексте моделей Кокса PH, но я не встречал ничего, связанного с параметрическими моделями? Есть ли реальный способ проверить предположение PH некоторых параметрических моделей? Кажется, что следует учитывать, что параметрические модели лишь немного отличаются от полупараметрических моделей Кокса? Например, если бы я …

10 survival assumptions proportional-hazards

1

R линейная регрессия категориальной переменной «скрытое» значение

Это всего лишь пример, с которым я сталкивался несколько раз, поэтому у меня нет примеров данных. Запуск модели линейной регрессии в R: a.lm = lm(Y ~ x1 + x2) x1является непрерывной переменной x2является категориальным и имеет три значения, например, «Низкий», «Средний» и «Высокий». Однако вывод, заданный R, будет выглядеть примерно …

10 r regression categorical-data regression-coefficients categorical-encoding machine-learning random-forest anova spss r self-study bootstrap monte-carlo r multiple-regression partitioning neural-networks normalization machine-learning svm kernel-trick self-study survival cox-model repeated-measures survey likert correlation variance sampling meta-analysis anova independence sample assumptions bayesian covariance r regression time-series mathematical-statistics graphical-model machine-learning linear-model kernel-trick linear-algebra self-study moments function correlation spss probability confidence-interval sampling mean population r generalized-linear-model prediction offset data-visualization clustering sas cart binning sas logistic causality regression self-study standard-error r distributions r regression time-series multiple-regression python chi-squared independence sample clustering data-mining rapidminer probability stochastic-processes clustering binary-data dimensionality-reduction svd correspondence-analysis data-visualization excel c# hypothesis-testing econometrics survey rating composite regression least-squares mcmc markov-process kullback-leibler convergence predictive-models r regression anova confidence-interval survival cox-model hazard normal-distribution autoregressive mixed-model r mixed-model sas hypothesis-testing mediation interaction

2

Предположения наименьших квадратов

Предположим следующую линейную зависимость: , где - зависимая переменная, - одна независимая переменная, а - термин ошибки.Y i X i u iYi=β0+β1Xi+uiYi=β0+β1Xi+uiY_i = \beta_0 + \beta_1 X_i + u_iYiYiY_iXiXiX_iuiuiu_i Согласно Stock & Watson (Введение в эконометрику; глава 4 ), третье предположение о наименьших квадратах состоит в том, что четвертые моменты …

9 regression least-squares assumptions bias consistency

3

Каковы последствия наличия непостоянной дисперсии в терминах ошибки в линейной регрессии?

Одно из предположений о линейной регрессии состоит в том, что должна быть постоянная дисперсия в терминах ошибок и что доверительные интервалы и проверки гипотез, связанные с моделью, основаны на этом предположении. Что именно происходит, когда члены ошибки не имеют постоянной дисперсии?

9 regression heteroscedasticity assumptions robust-standard-error

1

Когда можно написать «мы предположили нормальное распределение» эмпирического измерения?

В преподавании прикладных дисциплин, таких как медицина, заложено, что измерения биомедицинских величин в популяции следуют нормальной «кривой колокола». Поиск из Google в строке «мы предполагали , нормальное распределение» возвращает результатов! Они звучат так: «учитывая небольшое количество экстремальных точек данных, мы предполагали нормальное распределение температурных аномалий» в исследовании изменения климата; или …

9 normal-distribution assumptions normality-assumption lognormal

2

В чем разница между этими двумя тестами Бреуша-язычества?

Используя R на некоторых данных и пытаясь определить , являются ли мои данные гетероскедастичными, я нашел две реализации теста Бреуша -Пагана: bptest (package lmtest) и ncvTest (package car). Однако они дают разные результаты. Какая разница между двумя? Когда вы должны использовать один или другой? > model <- lm(y ~ x) …

9 r regression heteroscedasticity assumptions breusch-pagan

1

Вопрос о предположении нормальности t-критерия

Для t-тестов, согласно большинству текстов, есть предположение, что данные о населении обычно распределяются. Я не понимаю, почему это так. Разве t-критерий не требует только того, чтобы распределение выборки средних значений выборки было нормально распределено, а не совокупность? Если это так, что критерий Стьюдента в конечном итоге требует только нормальности в …

9 hypothesis-testing t-test assumptions normality-assumption central-limit-theorem

2

Как остатки связаны с основными нарушениями?

В методе наименьших квадратов мы хотим оценить неизвестные параметры в модели: YJ= α + βИксJ+ εJ( j = 1 ... n )YJзнак равноα+βИксJ+εJ(Jзнак равно1 ...N)Y_j = \alpha + \beta x_j + \varepsilon_j \enspace (j=1...n) Как только мы это сделаем (для некоторых наблюдаемых значений), мы получим подогнанную линию регрессии: YJ= α^+ …

9 regression least-squares residuals heteroscedasticity assumptions

2

Проверка предположения о пропорциональных шансах выполняется в порядковой логистической регрессии с использованием функции polr

Я использовал функцию 'polr' в пакете MASS, чтобы запустить порядковую логистическую регрессию для порядковой категориальной переменной ответа с 15 непрерывными объясняющими переменными. Я использовал код (показанный ниже), чтобы проверить, что моя модель соответствует предположению о пропорциональных шансах, следуя советам, приведенным в руководстве UCLA . Тем не менее, я немного беспокоюсь …

9 r logistic assumptions ordered-logit polr

Вопросы с тегом «assumptions»