Вопросы с тегом «terminology»

Использование и значение конкретных технических слов / понятий в статистике.

9
В чем разница между статистикой и биостатистикой?
Мне пришло в голову, что, хотя за последние годы я собрал воедино некоторые идеи о различиях между статистикой и биостатистикой, я никогда не слышал формального объяснения. В чем разница между этими двумя дисциплинами (в настоящее время)? И почему это различие началось в первую очередь? РЕДАКТИРОВАТЬ: Я не был достаточно конкретным …

4
Каковы различия между терминами «анализ временных рядов» и «анализ продольных данных»
Говоря о продольных данных, мы можем многократно ссылаться на данные, собранные с течением времени от одного и того же субъекта / единицы исследования, таким образом, существуют корреляции для наблюдений внутри одного и того же субъекта, т. Е. Сходство внутри объекта. Говоря о данных временного ряда, мы также ссылаемся на данные, …

1
Является ли контролируемое обучение подмножеством обучения с подкреплением?
Похоже, что определение контролируемого обучения является подмножеством обучающего обучения с особым типом функции вознаграждения, основанной на помеченных данных (в отличие от другой информации в среде). Это точное изображение?

3
Что такое нулевая модель в регрессии и как она связана с нулевой гипотезой?
Что такое нулевая модель в регрессии и какова связь между нулевой моделью и нулевой гипотезой? Насколько я понимаю, это значит Используя «среднее значение переменной отклика» для прогнозирования переменной непрерывного отклика? Использование «распределения меток» при прогнозировании дискретных переменных ответа? Если это так, то, похоже, отсутствует связь между нулевой гипотезой.

1
Тензоры в литературе по нейронным сетям: какое самое простое определение?
В литературе по нейронным сетям часто встречается слово «тензор». Это отличается от вектора? А из матрицы? У вас есть конкретный пример, который разъясняет его определение? Я немного запутался в его определении. Википедия не помогает, и иногда у меня складывается впечатление, что ее определение зависит от конкретной используемой среды машинного обучения …

2
Почему это называется «стандартным» отклонением?
У меня есть простой - и, возможно, очевидно тривиальный - вопрос: почему стандартное отклонение называется именно « стандартным »? Это потому, что стандартизирует сравнение наборов данных и результатов в отношении их дисперсии? Поиск в Stack Exchange не поднимает этот вопрос, равно как и поиск в Google по этимологии этого термина …


3
Что значит Тета?
Я новичок в статистике и нашел это . В статистике θ, строчная греческая буква 'theta', является обычным именем для (вектора) параметра (ов) некоторого общего распределения вероятностей. Распространенной проблемой является поиск значения (й) тэты. Обратите внимание, что нет никакого смысла в именовании параметра таким образом. Мы могли бы также назвать это …

2
Что именно означает «объединение данных»?
Я думал, что «объединение данных» просто означает объединение данных, которые ранее были разбиты на категории… по сути, игнорирование категорий и создание набора данных в один гигантский «пул» данных. Я думаю, что это вопрос больше о терминологии, чем о применении статистики. Например: я хочу сравнить 2 сайта, и на каждом сайте …


2
В чем разница между марковскими цепями и марковскими процессами?
В чем разница между марковскими цепями и марковскими процессами? Я читаю противоречивую информацию: иногда определение основано на том, является ли пространство состояний дискретным или непрерывным, а иногда - на том, является ли время дискретным или непрерывным. Слайд 20 этого документа : Марковский процесс называется цепью Маркова, если пространство состояний дискретно, …

4
Почему мы говорим, что переменная результата «регрессирует» на предиктор (ы)?
Есть ли интуитивное объяснение этой терминологии? Почему это так, а не предсказатель (ы) регрессируют на результат? В идеале я надеюсь, что правильное объяснение того, почему существует эта терминология, поможет студентам запомнить ее и помешать им сказать это неправильно.

2
Почему предельное распределение / предельная вероятность описываются как «предельное»?
Маргинал обычно относится к чему-то, что является небольшим эффектом, что-то, что находится за пределами большей системы. Это имеет тенденцию уменьшать важность того, что описывается как «маргинальный». Так как же это относится к вероятности подмножества случайных величин? Предполагая, что слова используются из-за их значения, это может быть рискованным суждением в математике, …

2
Что значит сказать, что событие «в конце концов случится»?
Рассмотрим одномерное случайное блуждание по целым числам ZZ\mathbb{Z} с начальным состоянием x∈Zx∈Zx\in\mathbb{Z} : Sn=x+∑i=1nξiSn=x+∑i=1nξi\begin{equation} S_n=x+\sum^n_{i=1}\xi_i \end{equation} где приращения ξiξi\xi_i равны IID, так что P{ξi=1}=P{ξi=−1}=12P{ξi=1}=P{ξi=−1}=12P\{\xi_i=1\}=P\{\xi_i=-1\}=\frac{1}{2} . Можно доказать, что (1) Px{Sn reaches +1 eventually}=1Px{Sn reaches +1 eventually}=1\begin{equation} P^x{\{S_n \text{ reaches +1 eventually}\}} = 1 \end{equation} где нижний индекс обозначает начальную позицию. …

4
Точность градиентной машины уменьшается с увеличением числа итераций
Я экспериментирую с алгоритмом машины повышения градиента через caretпакет в R. Используя небольшой набор данных для поступления в колледж, я запустил следующий код: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.