Вопросы с тегом «goodness-of-fit»

Тесты на соответствие подходят для определения того, разумно ли предполагать, что случайная выборка происходит из определенного распределения.

3
Как проверить, соответствует ли мои данные экспоненциальному распределению?
Как я могу проверить, являются ли мои данные, например, зарплата непрерывным экспоненциальным распределением в R? Вот гистограмма моего образца: , Любая помощь будет оценена!


5
Переоснащение: нет серебряной пули?
Насколько я понимаю, даже при соблюдении процедур перекрестной проверки и выбора модели может произойти переоснащение , если поискать модель будет достаточно сложно , если только он не налагает ограничения на сложность модели, период. Более того, часто люди пытаются узнать штрафы за сложность модели на основе данных, которые подрывают защиту, которую …

2
Сложность тестирования линейности в регрессии
В статистическом моделировании: две культуры Лев Брейман пишет В настоящее время применяется практика проверки соответствия модели данных с помощью тестов соответствия и анализа остаточных данных. Однажды, несколько лет назад, я поставил задачу симулированной регрессии в семи измерениях с контролируемой степенью нелинейности. Стандартные тесты на пригодность к приему не отклоняли линейность, …

2
Как измерить / аргументировать правильность соответствия линии тренда степенному закону?
У меня есть некоторые данные, которым я пытаюсь соответствовать линию тренда. Я полагаю, что данные соответствуют степенному закону, и поэтому нанесли данные на оси логарифма в поисках прямой линии. Это привело к (почти) прямой линии, поэтому в Excel я добавил линию тренда для степенного закона. Поскольку я новичок в статистике, …

4
Каковы правильные значения для точности и отзыва в крайних случаях?
Точность определяется как: p = true positives / (true positives + false positives) Является ли это исправить , что, как true positivesи false positivesподход 0, точность приближается к 1? Тот же вопрос для отзыва: r = true positives / (true positives + false negatives) В настоящее время я выполняю статистический …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

2
Является ли взвешенный
Я оценил надежную линейную модель Rс весами ММ, используя rlm()пакет MASS. `R`` не предоставляет значение для модели, но я хотел бы иметь его, если это значимое количество. Мне также интересно знать, есть ли смысл иметь значение которое взвешивает общую и остаточную дисперсию так же, как взвешивания наблюдений в устойчивой регрессии. …

1
Хорошая посадка и какую модель выбрать линейную регрессию или Пуассона
Мне нужны некоторые советы относительно двух основных дилемм в моем исследовании, которое представляет собой исследование трех крупных фармацевтических препаратов и инноваций. Количество патентов в год является зависимой переменной. Мои вопросы Каковы наиболее важные критерии для хорошей модели? Что более / менее важно? Это то, что большинство или все переменные будут …

1
Хорошо подходит для 2D гистограмм
У меня есть два набора данных, представляющих параметры звезд: наблюдаемый и смоделированный. С помощью этих наборов я создаю так называемую двухцветную диаграмму (TCD). Образец можно увидеть здесь: Быть наблюдаемые данные и Аргументы B данных , извлеченные из модели (не говоря уже о черных линиях, точки представляют данные) У меня есть …

2
Влияние границ бина на основе данных на критерий пригодности хи-квадрат?
Оставляя в стороне очевидную проблему малой мощности хи-квадрата в подобных обстоятельствах, представьте себе, что вы проводите проверку качества хи-квадрата для некоторой плотности с неопределенными параметрами путем объединения данных. Для конкретности, скажем, экспоненциальное распределение с неизвестным средним и размером выборки, скажем, 100. Чтобы получить разумное количество ожидаемых наблюдений на одну ячейку, …

4
Какая связь между
Мне было интересно, есть ли связь между и F-Test.R2R2R^2 Обычно и измеряет силу линейные отношения в регрессии.R2=∑(Y^t−Y¯)2/T−1∑(Yt−Y¯)2/T−1R2=∑(Y^t−Y¯)2/T−1∑(Yt−Y¯)2/T−1R^2=\frac {\sum (\hat Y_t - \bar Y)^2 / T-1} {\sum( Y_t - \bar Y)^2 / T-1} F-тест просто подтверждает гипотезу. Есть ли связь между и F-тестом?R2R2R^2

3
Что означает отрицательный R-квадрат?
Допустим, у меня есть некоторые данные, а затем я подгоняю данные с помощью модели (нелинейная регрессия). Затем я вычисляю R-квадрат ( р2р2R^2 ). Когда R-квадрат отрицательный, что это значит? Значит ли это, что моя модель плохая? Я знаю, что диапазон р2р2R^2 может быть [-1,1]. Когда р2р2R^2 равен 0, что это …

2
Остатки Пирсона
Вопрос новичка об остатке Пирсона в контексте теста хи-квадрат на соответствие формы: Помимо статистики теста, chisq.testфункция R сообщает об остатке Пирсона: (obs - exp) / sqrt(exp) Я понимаю, почему смотреть на необработанную разницу между наблюдаемыми и ожидаемыми значениями не так информативно, так как меньшая выборка приведет к меньшей разнице. Однако …

5
Проверка предположений ANOVA
Несколько месяцев назад я опубликовал вопрос о тестах гомоскедастичности в R на SO, и Ян Феллоуз ответил на это (я перефразирую его ответ очень свободно): Тесты на гомоскедастичность не являются хорошим инструментом при проверке соответствия вашей модели. С небольшими выборками у вас недостаточно мощности, чтобы обнаружить отклонения от гомоскедастичности, в …

2
Апостериорный тест для критерия пригодности хи-квадрат
Я провожу тест на соответствие критерию хи-квадрат (GOF) с тремя категориями и специально хочу проверить нулевое, что пропорции населения в каждой категории равны (то есть пропорция составляет 1/3 в каждой группе): НАБЛЮДЕННЫЕ ДАННЫЕ Группа 1 Группа 2 Группа 3 Всего 686 928 1012 2626 Таким образом, для этого теста GOF …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.