Вопросы с тегом «mean»

Ожидаемое значение случайной величины; или мера местоположения для образца.

1
Можем ли мы использовать одно среднее значение и стандартное отклонение, чтобы выявить выбросы?
Предположим, у меня есть нормально распределенные данные. Для каждого элемента данных я хочу проверить, сколько SD находится от среднего значения. В данных могут быть выбросы (вероятно, только один, но могут быть также два или три) или нет, но этот выброс в основном то, что я ищу. Имеет ли смысл временно …

3
Максимальное значение коэффициента вариации для ограниченного набора данных
В ходе дискуссии после недавнего вопроса о том, может ли стандартное отклонение превышать среднее значение, один вопрос был поднят кратко, но так и не получил полного ответа. Поэтому я спрашиваю это здесь. Рассмотрим набор из неотрицательных чисел где для . Не требуется, чтобы x_i был отличным, то есть набор мог …

5
Всегда ли среднее значение одномерной случайной величины равно интегралу ее квантильной функции?
Я только что заметил, что интеграция квантовой функции одномерной случайной величины (обратной cdf) от p = 0 до p = 1 дает среднее значение переменной. Я не слышал об этих отношениях до сих пор, поэтому мне интересно: это всегда так? Если так, широко ли известны эти отношения? Вот пример в …

7
Медиана справедливее, чем значит?
Я недавно прочитал совет, что вы должны использовать медиану, а не средство для устранения выбросов. Пример: следующая статья http://www.amazon.com/Forensic-Science-Introduction-Scientific-Investigative/product-reviews/1420064932/ имеет 16 отзывов на данный момент: review= c(5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 4, 4, 3, 2, 1, 1) summary(review) ## "ordinary" summary Min. 1st Qu. Median …
17 mean  median  average 

2
Как рассчитать среднюю продолжительность приверженности вегетарианству, когда у нас есть только данные опросов о текущих вегетарианцах?
Была обследована случайная выборка населения. Их спросили, придерживаются ли они вегетарианской диеты. Если они ответили «да», их также попросили указать, как долго они питались вегетарианской диетой без перерыва. Я хочу использовать эти данные для расчета средней продолжительности приверженности вегетарианству. Другими словами, когда кто-то становится вегетарианцем, я хочу знать, что в …

5
Что означает объединенная дисперсия «на самом деле»?
Я новичок в статистике, так что вы, ребята, не могли бы вы мне помочь? Мой вопрос заключается в следующем: что на самом деле означает объединенная дисперсия ? Когда я ищу формулу для объединенной дисперсии в Интернете, я нахожу много литературы, использующей следующую формулу (например, здесь: http://math.tntech.edu/ISR/Maturgical_Statistics/Introduction_to_Statistical_Tests/thispage/newnode19.html ): S2p=S21(n1−1)+S22(n2−1)n1+n2−2Sp2=S12(n1−1)+S22(n2−1)n1+n2−2\begin{equation} \label{eq:stupidpooledvar} \displaystyle …
15 variance  mean  pooling 

1
Должен ли я использовать t-тест для сильно искаженных данных? Научное доказательство, пожалуйста?
У меня есть образцы из сильно искаженного (похожего на экспоненциальный дистрибутив) набора данных об участии пользователей (например, количество постов), которые имеют разные размеры (но не менее 200), и я хочу сравнить их среднее значение. Для этого я использую непарные t-тесты с двумя образцами (и t-тесты с коэффициентом Уэлча, когда образцы …

1
Какова интуиция за сменными образцами при нулевой гипотезе?
Тесты перестановки (также называемые тестом рандомизации, тестом повторной рандомизации или точным тестом) очень полезны и оказываются полезными, когда предположение о нормальном распределении, требуемое, например, t-testне выполняется, и когда преобразование значений путем ранжирования непараметрическое тестирование, как, Mann-Whitney-U-testможет привести к потере большего количества информации. Тем не менее, одно и только одно предположение …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

9
Может ли стандартное отклонение неотрицательных данных превышать среднее значение?
У меня есть триангулированные трехмерные сетки. Статистика для областей треугольника: Мин 0,000 Макс 2341,141 Среднее 56,317 Стандартное отклонение 98.720 Итак, означает ли это что-нибудь особенно полезное в отношении стандартного отклонения или предполагает наличие ошибок при его расчете, когда цифры работают, как указано выше? Районы, безусловно, далеки от нормального распределения. И, …

3
Ускоренный курс в устойчивой средней оценке
У меня есть куча (около 1000) оценок, и все они должны быть оценками долгосрочной эластичности. Чуть более половины из них оценивается с использованием метода A, а остальные - с использованием метода B. Где-то я читал что-то вроде: «Я думаю, что метод B оценивает что-то очень отличное от метода A, потому …

1
Преобразовать данные в желаемое среднее значение и стандартное отклонение
Я ищу метод для преобразования моего набора данных из его текущего среднего значения и стандартного отклонения в целевое среднее значение и целевое стандартное отклонение. По сути, я хочу уменьшить / расширить дисперсию и масштабировать все числа до среднего. Это не работает, чтобы сделать два отдельных линейных преобразования, одно для стандартного …

1
Как называется среднее из самых больших и самых маленьких значений в данном наборе данных?
Что вы называете статистическим средним, которое вычисляется из верхних и нижних крайних значений в любом данном наборе данных? Например, если у вас есть набор: { -2, 0 , 8, 9, 1, 50, -2, 6} Верхний предел этого набора равен 50нижнему пределу -2. Таким образом, среднее значение крайностей будет(-2 + 50 …

1
Карет глмнет против cv.glmnet
Кажется, существует большая путаница при сравнении использования glmnetвнутри caretдля поиска оптимальной лямбды и использования cv.glmnetдля выполнения той же задачи. Было задано много вопросов, например: Модель классификации train.glmnet против cv.glmnet? Как правильно использовать glmnet с кареткой? Перекрестная проверка `glmnet` с использованием` caret` но ответа не дано, что может быть связано с …


4
Следует ли использовать среднее значение при перекосе данных?
Часто вводные тексты по прикладной статистике отличают среднее от медианного (часто в контексте описательной статистики и мотивации суммирования центральной тенденции с использованием среднего, медианного значения и режима), объясняя, что среднее значение чувствительно к выбросам в данных выборки и / или искаженное распределение населения, и это используется в качестве оправдания для …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.