Вопросы с тегом «mean»

Ожидаемое значение случайной величины; или мера местоположения для образца.

2
Существует ли примерная версия одностороннего чебышевского неравенства?
Меня интересует следующая односторонняя версия неравенства Чебышева Кантелли : P ( X- E ( X) ≥ t ) ≤ V a r ( X)V a r (X) + т2,п(Икс-Е(Икс)≥T)≤Вaр(Икс)Вaр(Икс)+T2, \mathbb P(X - \mathbb E (X) \geq t) \leq \frac{\mathrm{Var}(X)}{\mathrm{Var}(X) + t^2} \,. По сути, если вы знаете среднее значение и …

4
Каковы относительные преимущества данных Winsorizing и Trimming?
Обесцвечивание данных означает замену крайних значений набора данных определенным значением процентиля с каждого конца, в то время как Обрезка или Усечение включает удаление этих предельных значений. Я всегда вижу, что оба метода обсуждаются как жизнеспособный вариант, чтобы уменьшить влияние выбросов при вычислении статистики, такой как среднее значение или стандартное отклонение, …

8
Замена выбросов на среднее
Этот вопрос был задан моим другом, который не разбирается в Интернете. У меня нет статистики, и я искал в интернете этот вопрос. Вопрос в том, можно ли заменить выбросы средним значением? если это возможно, есть ли какие-либо книги / журналы, чтобы подтвердить это утверждение?

5
В чем разница между «средним значением» и «средним»?
Википедия объясняет: Для набора данных среднее значение представляет собой сумму значений, деленную на количество значений. Это определение, однако, соответствует тому, что я называю «средним» (по крайней мере, это то, что я помню, изучая). И все же Википедия еще раз цитирует: Существуют и другие статистические показатели, в которых используются выборки, которые …

4
Означает ли среднее = мода симметричное распределение?
Я знаю, что этот вопрос задавался со средним регистром = медианой, но я не нашел ничего, связанного со средним = модой. Если мода равна среднему значению, могу ли я всегда заключить, что это симметричное распределение? Буду ли я вынужден знать также медиану для этого способа?

2
Существует ли надежный непараметрический доверительный интервал для среднего перекошенного распределения?
Очень искаженные распределения, такие как log-normal, не дают точных доверительных интервалов начальной загрузки. Вот пример, показывающий, что левая и правая области хвоста далеки от идеальных 0,025 независимо от того, какой метод начальной загрузки вы используете в R: require(boot) n <- 25 B <- 1000 nsim <- 1000 set.seed(1) which <- …

5
Как работать с иерархическими / вложенными данными в машинном обучении
Я объясню мою проблему на примере. Предположим, вы хотите предсказать доход человека с учетом некоторых атрибутов: {Возраст, Пол, Страна, Регион, Город}. У вас есть тренировочный набор данных, как так train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

10
Регресс к среднему значению против заблуждения игрока
С одной стороны, у меня есть регресс к среднему значению, а с другой - у меня ошибка игрока . Ошибка Игрока определяется Миллером и Санджурджо (2019) как «ошибочное убеждение, что случайные последовательности имеют систематическую тенденцию к развороту, то есть, что полосы схожих результатов скорее заканчиваются, чем продолжаются». Например, упавшая монета …

1
Могут ли степени свободы быть нецелым числом?
Когда я использую GAM, он дает мне остаточный DF, (последняя строка в коде). Что это значит? Выходя за рамки примера GAM, в общем, может ли число степеней свободы быть нецелым числом?26,626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

3
Чем нахождение центроида отличается от нахождения среднего значения?
При выполнении иерархической кластеризации можно использовать множество метрик для измерения расстояния между кластерами. Две такие метрики подразумевают вычисление центроидов и средних точек данных в кластерах. В чем разница между средним и центроидом? Разве это не одна и та же точка в кластере?
26 clustering  mean 

3
Как вычислить доверительный интервал отношения двух нормальных средних
Я хочу вывести пределы для доверительного интервала для отношения двух средних. Предположим, что и независимы, среднее отношение . Я пытался решить: но это уравнение не может быть решено во многих случаях (без корней). Я делаю что-то неправильно? Есть ли лучший подход? БлагодарностьX 1 ∼ N ( θ 1 , σ …

3
Что можно сделать вывод о данных, когда среднее арифметическое очень близко к среднему геометрическому?
Есть ли что-то существенное в среднем геометрическом и среднем арифметическом значении, которое находится очень близко друг к другу, скажем, ~ 0,1%? Какие предположения можно сделать о таком наборе данных? Я работал над анализом набора данных и заметил, что по иронии судьбы значения очень и очень близки. Не точно, но близко. …

4
Как определить, симметрично ли распределение данных?
Я знаю, что если медиана и среднее значение приблизительно равны, то это означает, что существует симметричное распределение, но в данном конкретном случае я не уверен. Среднее значение и медиана довольно близки (разница составляет всего 0,487 м / галл), что заставляет меня сказать, что существует симметричное распределение, но, глядя на коробочный …

4
Почему среднее значение более стабильно в разных выборках, чем в среднем?
Раздел 1.7.2 Обнаружения Статистики Используя R Энди Филдсом и др., Перечисляя достоинства среднего значения по отношению к медиане, утверждает: ... среднее значение стабильно в разных выборках. Это после объяснения многих достоинств медианы, например, ... Медиана относительно не зависит от экстремальных показателей на обоих концах распределения ... Учитывая, что медиана относительно …
22 mean  median 


Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.