Вопросы с тегом «distributions»

Распределение - это математическое описание вероятностей или частот.

1
Вычисление повторяемости эффектов по модели Лмера
Я только что наткнулся на эту статью , в которой описывается, как вычислить повторяемость (или надежность, или внутриклассовую корреляцию) измерения с помощью моделирования смешанных эффектов. Код R будет: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

7
Как генерировать числа на основе произвольного дискретного распределения?
Как генерировать числа на основе произвольного дискретного распределения? Например, у меня есть набор чисел, которые я хочу сгенерировать. Скажем, они помечены как 1-3 следующим образом. 1: 4%, 2: 50%, 3: 46% По сути, проценты - это вероятность того, что они появятся в выходных данных генератора случайных чисел. У меня есть …

3
Существуют ли функции по умолчанию для дискретных равномерных распределений в R?
Большинство стандартных дистрибутивов в R имеют семейство команд - pdf / pmf, cdf / cmf, квантиль, случайные отклонения (например, dnorm, pnorm, qnorm, rnorm). Я знаю, что достаточно просто использовать некоторые стандартные команды для воспроизведения этих функций для дискретных равномерных распределений, но есть ли уже предпочтительное встроенное семейство функций для моделирования …

6
С точки зрения непрофессионала, в чем разница между моделью и распределением?
Ответы (определения), определенные в Википедии, возможно, немного загадочны для тех, кто не знаком с высшей математикой / статистикой. В математических терминах, статистическая модель обычно считается как пара ( S,PS,пS, \mathcal{P} ), где SSS есть множество возможных наблюдений, т.е. выборочного пространства, и есть множество вероятностных распределений на . SPп\mathcal{P}SSS В вероятности …

3
Почему RSS распространяется через квадраты времени np?
Я хотел бы понять, почему в рамках модели OLS RSS (остаточная сумма квадратов) распределяется ( - это число параметров в модели, - количество наблюдений).χ2⋅(n−p)χ2⋅(n−p)\chi^2\cdot (n-p)pppnnn Я прошу прощения за то, что задал такой простой вопрос, но мне кажется, что я не могу найти ответ онлайн (или в моих, более ориентированных …

1
Могут ли степени свободы быть нецелым числом?
Когда я использую GAM, он дает мне остаточный DF, (последняя строка в коде). Что это значит? Выходя за рамки примера GAM, в общем, может ли число степеней свободы быть нецелым числом?26,626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

2
Что именно представляет собой альфа в распределении Дирихле?
Я довольно новичок в байесовской статистике, и я наткнулся на исправленную меру корреляции SparCC , которая использует процесс Дирихле в бэкэнде своего алгоритма. Я пытался пройтись по алгоритму шаг за шагом, чтобы действительно понять, что происходит, но я не уверен, что именно делает alphaпараметр вектора в распределении Дирихле и как …

5
Интуитивное объяснение сходимости в распределении и сходимости по вероятности
Какова интуитивная разница между случайной величиной, сходящейся по вероятности, и случайной величиной, сходящейся по распределению? Я прочитал множество определений и математических уравнений, но это не очень помогает. (Пожалуйста, имейте в виду, я студент, изучающий эконометрику.) Как случайная величина может сходиться к одному числу, но также сходиться к распределению?

7
Проверка гипотезы распределения - какой смысл делать это, если вы не можете «принять» свою нулевую гипотезу?
Различные тесты гипотез, такие как тест GOF, Колмогоров-Смирнов, Андерсон-Дарлинг и т. Д., Следуют этому базовому формату:χ2χ2\chi^{2} ЧАС0H0H_0 : данные следуют заданному распределению. ЧАС1H1H_1 : данные не соответствуют данному распределению. Как правило, оценивается утверждение о том, что некоторые данные следуют некоторому заданному распределению, и если кто-то отвергает , данные не подходят …

2
Имеет ли
Я столкнулся с этой плотностью на днях. Кто-то дал это имя? f(x)=log(1+x−2)/2πf(x)=log⁡(1+x−2)/2πf(x) = \log(1 + x^{-2}) / 2\pi Плотность в источнике бесконечна, а также имеет толстые хвосты. Я видел, что это использовалось как предварительное распределение в контексте, где многие наблюдения, как ожидали, будут маленькими, хотя большие значения ожидались также

2
Помогите мне понять квантильную (обратную CDF) функцию
Я читаю о функции квантиля, но она мне не понятна. Не могли бы вы дать более интуитивное объяснение, чем приведенное ниже? Поскольку cdf является монотонно возрастающей функцией, она имеет обратную; обозначим это через . Если - это cdf файла , то - это значение такое что ; это называется квантиль …

5
Как линейная регрессия использует нормальное распределение?
При линейной регрессии предполагается, что каждое прогнозируемое значение было выбрано из нормального распределения возможных значений. Увидеть ниже. Но почему предполагается, что каждое прогнозируемое значение получено из нормального распределения? Как линейная регрессия использует это предположение? Что, если возможные значения обычно не распределяются?

6
Каковы хорошие методы визуализации данных для сравнения распределений?
Я пишу свою кандидатскую диссертацию, и я понял, что чрезмерно полагаюсь на коробочные графики, чтобы сравнивать распределения. Какие еще альтернативы вам нравятся для решения этой задачи? Я также хотел бы спросить, знаете ли вы какой-либо другой ресурс, как галерею R, в котором я могу вдохновить себя различными идеями по визуализации …

3
Почему работает тест Колмогорова-Смирнова?
Читая о тесте KS с двумя образцами, я точно понимаю, что он делает, но я не понимаю, почему он работает . Другими словами, я могу выполнить все шаги для вычисления эмпирических функций распределения, найти максимальную разницу между ними, чтобы найти D-статистику, вычислить критические значения, преобразовать D-статистику в p-значение и т. …

2
Я слышал, что соотношения или инверсии случайных величин часто проблематичны, поскольку не имеют ожиданий. Почему это?
Название вопроса. Мне говорят, что отношения и инверсии случайных величин часто проблематичны. Это означает, что ожидания часто не существуют. Есть ли простое, общее объяснение этого?

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.