Вопросы с тегом «definition»

Этот тег указывает на вопросы об определениях статистических терминов. Используйте более общий тег [терминология] для вопросов статистической терминологии, которые не относятся конкретно к определениям.

3
Что именно является дистрибутивом?
Я очень мало знаю о вероятности и статистике, и я хочу учиться. Я вижу слово «распространение», используемое повсеместно в разных контекстах. Например, дискретная случайная величина имеет «распределение вероятностей». Я знаю что это. Непрерывная случайная величина имеет функцию плотности вероятности, тогда для интеграл от до функции плотности вероятности является кумулятивной функцией …

4
Точность градиентной машины уменьшается с увеличением числа итераций
Я экспериментирую с алгоритмом машины повышения градиента через caretпакет в R. Используя небольшой набор данных для поступления в колледж, я запустил следующий код: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

5
Разница между терминами «совместное распределение» и «многомерное распределение»?
Я пишу об использовании «совместного распределения вероятностей» для аудитории, которая с большей вероятностью поймет «многомерное распределение», поэтому я подумываю использовать позже. Тем не менее, я не хочу терять смысл при этом. Википедия, кажется, указывает, что это синонимы. Они? Если нет, то почему нет?

1
Каково точное определение «дела Хейвуда»?
Я несколько неофициально использовал термин «случай Хейвуда» для обозначения ситуаций, когда онлайновая итеративно обновляемая оценка «конечного ответа» дисперсии становилась отрицательной из-за проблем с числовой точностью. (Я использую вариант метода Уэлфорда для добавления данных и удаления более старых данных.) У меня сложилось впечатление, что он применяется к любой ситуации, когда оценка …

2
Примеры статистики, которая не зависит от распределения выборки?
Это определение для статистики в Википедии Более формально, статистическая теория определяет статистику как функцию выборки, где сама функция не зависит от распределения выборки; то есть функция может быть задана до реализации данных. Термин статистика используется как для функции, так и для значения функции в данном образце. Я думаю, что понимаю …

1
Как «Фундаментальная теорема факторного анализа» применяется к PCA или как определяются нагрузки PCA?
В настоящее время я изучаю набор слайдов для «факторного анализа» (насколько я могу судить по PCA). В ней выводится «фундаментальная теорема факторного анализа», которая утверждает, что корреляционная матрица данных, поступающих в анализ ( ), может быть восстановлена ​​с использованием матрицы факторных нагрузок ( ):RR\bf RAA\bf A R=AA⊤R=AA⊤\bf R = AA^\top …

1
Confounder - определение
Согласно М. Кацу в его книге « Анализ многовариантности» (Раздел 1.2, стр. 6): « Определяющий фактор связан с фактором риска и причинно связан с результатом. » Почему оппонент должен быть причинно связан с результатом? Достаточно ли будет связывающего с результатом?

2
Вы отвергаете нулевую гипотезу, когда
Это явно вопрос определения или соглашения, и он практически не имеет практического значения. Если для αα\alpha установлено традиционное значение 0,05, считается ли значение ppp 0,0500000000000 ... статистически значимым или нет? Является ли правило определения статистической значимости p&lt;αp&lt;αp < \alpha или p≤αp≤αp \leq \alpha ??

6
В чем разница между эффективностью и действенностью при определении пользы терапии «А» при условии «В»?
Контекст этого вопроса находится в рамках здравоохранения, т. Е. Рассматривает один или несколько методов лечения при заболевании. Похоже, что даже уважаемые исследователи путают термины действенность и эффективность , используя термины взаимозаменяемо. Как можно думать об эффективности по сравнению с эффективностью таким образом, чтобы помочь устранить путаницу? Какой тип дизайна исследования …

2
означает ли оператор (x)?
Я видел оператор do(x)do(x)do(x) везде в обзоре литературы, который я делаю о причинности (см., Например, эту запись в Википедии ). Однако я не могу найти формальное и общее определение этого оператора. Может кто-нибудь указать мне хорошую ссылку на это? Меня интересует общее определение, а не его интерпретация в конкретном эксперименте.

2
Что такое Тэмпсон Сэмплинг с точки зрения непрофессионала?
Я не могу понять Тэмпсон Сэмплинг и как это работает. Я читал о Multi Arm Bandit и после прочтения Upper Confidence Bound Algorithm многие тексты предположили, что сэмплинг Thompson работает лучше, чем UCB. Что такое Тэмпсон Сэмплинг, с точки зрения непрофессионала или просто? Не стесняйтесь предоставлять справочные статьи для дальнейшего …


3
Определение и разграничение регрессионной модели
Смущающий простой вопрос - но, кажется, его не задавали на Cross Validated раньше: Каково определение модели регрессии? Также вопрос поддержки, Чем не модель регрессии? Что касается последнего, меня интересуют хитрые примеры, где ответ не сразу очевиден, например, ARIMA или GARCH.

2
Что такое регулярности и регуляризация?
Я слышу эти слова все больше и больше, когда изучаю машинное обучение. Фактически, некоторые люди выиграли медаль Филдса, работающую над закономерностями уравнений. Итак, я думаю, что это термин, который переносится от статистической физики / математики к машинному обучению. Естественно, некоторые люди, которых я спросил, просто не могли это интуитивно объяснить. …

5
Как выполнить вменение значений в очень большом количестве точек данных?
У меня очень большой набор данных и около 5% случайных значений отсутствуют. Эти переменные связаны друг с другом. В следующем примере набор данных R - просто игрушечный пример с фиктивными коррелированными данными. set.seed(123) # matrix of X variable xmat &lt;- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) &lt;- …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.