Статистика и большие данные terminology

9

В чем разница между статистикой и биостатистикой?

Мне пришло в голову, что, хотя за последние годы я собрал воедино некоторые идеи о различиях между статистикой и биостатистикой, я никогда не слышал формального объяснения. В чем разница между этими двумя дисциплинами (в настоящее время)? И почему это различие началось в первую очередь? РЕДАКТИРОВАТЬ: Я не был достаточно конкретным …

17 terminology biostatistics

4

Каковы различия между терминами «анализ временных рядов» и «анализ продольных данных»

Говоря о продольных данных, мы можем многократно ссылаться на данные, собранные с течением времени от одного и того же субъекта / единицы исследования, таким образом, существуют корреляции для наблюдений внутри одного и того же субъекта, т. Е. Сходство внутри объекта. Говоря о данных временного ряда, мы также ссылаемся на данные, …

17 time-series terminology panel-data

1

Является ли контролируемое обучение подмножеством обучения с подкреплением?

Похоже, что определение контролируемого обучения является подмножеством обучающего обучения с особым типом функции вознаграждения, основанной на помеченных данных (в отличие от другой информации в среде). Это точное изображение?

16 machine-learning terminology reinforcement-learning supervised-learning definition

3

Что такое нулевая модель в регрессии и как она связана с нулевой гипотезой?

Что такое нулевая модель в регрессии и какова связь между нулевой моделью и нулевой гипотезой? Насколько я понимаю, это значит Используя «среднее значение переменной отклика» для прогнозирования переменной непрерывного отклика? Использование «распределения меток» при прогнозировании дискретных переменных ответа? Если это так, то, похоже, отсутствует связь между нулевой гипотезой.

16 regression hypothesis-testing classification terminology model

1

Тензоры в литературе по нейронным сетям: какое самое простое определение?

В литературе по нейронным сетям часто встречается слово «тензор». Это отличается от вектора? А из матрицы? У вас есть конкретный пример, который разъясняет его определение? Я немного запутался в его определении. Википедия не помогает, и иногда у меня складывается впечатление, что ее определение зависит от конкретной используемой среды машинного обучения …

16 neural-networks terminology definition tensor

2

Почему это называется «стандартным» отклонением?

У меня есть простой - и, возможно, очевидно тривиальный - вопрос: почему стандартное отклонение называется именно « стандартным »? Это потому, что стандартизирует сравнение наборов данных и результатов в отношении их дисперсии? Поиск в Stack Exchange не поднимает этот вопрос, равно как и поиск в Google по этимологии этого термина …

16 standard-deviation terminology history etymology

2

Что такое «частичное» в методах частичных наименьших квадратов?

Что означает термин «частичный» в моделировании структурных уравнений с частичной наименьших квадратов (PLSR) или частичных наименьших квадратов (PLS-SEM)?

16 multiple-regression least-squares terminology sem partial-least-squares

3

Что значит Тета?

Я новичок в статистике и нашел это . В статистике θ, строчная греческая буква 'theta', является обычным именем для (вектора) параметра (ов) некоторого общего распределения вероятностей. Распространенной проблемой является поиск значения (й) тэты. Обратите внимание, что нет никакого смысла в именовании параметра таким образом. Мы могли бы также назвать это …

16 terminology

2

Что именно означает «объединение данных»?

Я думал, что «объединение данных» просто означает объединение данных, которые ранее были разбиты на категории… по сути, игнорирование категорий и создание набора данных в один гигантский «пул» данных. Я думаю, что это вопрос больше о терминологии, чем о применении статистики. Например: я хочу сравнить 2 сайта, и на каждом сайте …

16 terminology

2

Постоянство во временных рядах

Может ли кто-нибудь сказать мне, что означает термин «постоянство» в анализе временных рядов? Это касается эконометрики и прикладной регрессии.

16 regression time-series econometrics terminology

2

В чем разница между марковскими цепями и марковскими процессами?

В чем разница между марковскими цепями и марковскими процессами? Я читаю противоречивую информацию: иногда определение основано на том, является ли пространство состояний дискретным или непрерывным, а иногда - на том, является ли время дискретным или непрерывным. Слайд 20 этого документа : Марковский процесс называется цепью Маркова, если пространство состояний дискретно, …

16 terminology stochastic-processes markov-process

4

Почему мы говорим, что переменная результата «регрессирует» на предиктор (ы)?

Есть ли интуитивное объяснение этой терминологии? Почему это так, а не предсказатель (ы) регрессируют на результат? В идеале я надеюсь, что правильное объяснение того, почему существует эта терминология, поможет студентам запомнить ее и помешать им сказать это неправильно.

16 regression terminology teaching

2

Почему предельное распределение / предельная вероятность описываются как «предельное»?

Маргинал обычно относится к чему-то, что является небольшим эффектом, что-то, что находится за пределами большей системы. Это имеет тенденцию уменьшать важность того, что описывается как «маргинальный». Так как же это относится к вероятности подмножества случайных величин? Предполагая, что слова используются из-за их значения, это может быть рискованным суждением в математике, …

15 probability terminology

2

Что значит сказать, что событие «в конце концов случится»?

Рассмотрим одномерное случайное блуждание по целым числам ZZ\mathbb{Z} с начальным состоянием x∈Zx∈Zx\in\mathbb{Z} : Sn=x+∑i=1nξiSn=x+∑i=1nξi\begin{equation} S_n=x+\sum^n_{i=1}\xi_i \end{equation} где приращения ξiξi\xi_i равны IID, так что P{ξi=1}=P{ξi=−1}=12P{ξi=1}=P{ξi=−1}=12P\{\xi_i=1\}=P\{\xi_i=-1\}=\frac{1}{2} . Можно доказать, что (1) Px{Sn reaches +1 eventually}=1Px{Sn reaches +1 eventually}=1\begin{equation} P^x{\{S_n \text{ reaches +1 eventually}\}} = 1 \end{equation} где нижний индекс обозначает начальную позицию. …

15 probability terminology stochastic-processes randomness random-walk

4

Точность градиентной машины уменьшается с увеличением числа итераций

Я экспериментирую с алгоритмом машины повышения градиента через caretпакет в R. Используя небольшой набор данных для поступления в колледж, я запустил следующий код: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. …

15 machine-learning caret boosting gbm hypothesis-testing t-test panel-data psychometrics intraclass-correlation generalized-linear-model categorical-data binomial model intercept causality cross-correlation distributions ranks p-value z-test sign-test time-series references terminology cross-correlation definition probability distributions beta-distribution inverse-gamma missing-data paired-comparisons paired-data clustered-standard-errors cluster-sample time-series arima logistic binary-data odds-ratio medicine hypothesis-testing wilcoxon-mann-whitney unsupervised-learning hierarchical-clustering neural-networks train clustering k-means regression ordinal-data change-scores machine-learning experiment-design roc precision-recall auc stata multilevel-analysis regression fitting nonlinear jmp r data-visualization gam gamm4 r lme4-nlme many-categories regression causality instrumental-variables endogeneity controlling-for-a-variable

Вопросы с тегом «terminology»