Вопросы с тегом «median»

Медиана - это значение, ниже которого лежит половина данных или распределения вероятности - когда размер выборки нечетный, медиана является «средним» значением упорядоченной выборки.

8
Если среднее значение настолько чувствительно, зачем использовать его в первую очередь?
Это известный факт, что медиана устойчива к выбросам. Если это так, то когда и почему мы будем использовать среднее значение в первую очередь? Возможно, я могу придумать одну вещь: понять наличие выбросов, то есть если медиана далека от среднего значения, тогда распределение искажено и, возможно, необходимо изучить данные, чтобы решить, …


5
Центральная предельная теорема для выборочных медиан
Если я вычислю медиану достаточно большого числа наблюдений, взятых из одного и того же распределения, будет ли в центральной предельной теореме аппроксимация распределения медиан приближаться к нормальному? Насколько я понимаю, это верно для большого количества образцов, но верно ли это для медиан? Если нет, каково основное распределение выборочных медиан?

10
Каков хороший алгоритм для оценки медианы огромного набора данных с однократным чтением?
Я ищу хороший алгоритм (подразумевающий минимальные вычисления, минимальные требования к хранилищу) для оценки медианы набора данных, который слишком велик для хранения, так что каждое значение может быть прочитано только один раз (если вы явно не сохраните это значение). На данных, которые можно предположить, нет границ. Аппроксимации хороши, пока точность известна. …

13
Почему средний возраст лучше, чем средний возраст?
Если вы посмотрите на Wolfram Alpha Или эта страница в Википедии Список стран по медианному возрасту Очевидно, медиана является статистикой выбора, когда речь идет о возрастах. Я не могу объяснить себе, почему среднее арифметическое было бы хуже статистики. Почему это так? Первоначально размещен здесь, потому что я не знал, что …
41 mean  median 


7
Есть ли общепринятое определение медианы образца на плоскости или более упорядоченных пространств?
Если так, то? Если нет, то почему? Для выборки на линии медиана минимизирует общее абсолютное отклонение. Казалось бы, естественно расширить определение до R2 и т. Д., Но я никогда не видел его. Но потом я уже давно на левом поле.

3
Почему базовое тестирование гипотез фокусируется на среднем, а не на медиане?
На базовых курсах по статистике для студентов (обычно?) Обучают проверке гипотез для среднего населения. Почему основное внимание уделяется среднему значению, а не срединному значению? Я предполагаю, что из-за центральной предельной теоремы легче проверить среднее значение, но я бы хотел прочитать некоторые обоснованные объяснения.

2
Существует ли надежный непараметрический доверительный интервал для среднего перекошенного распределения?
Очень искаженные распределения, такие как log-normal, не дают точных доверительных интервалов начальной загрузки. Вот пример, показывающий, что левая и правая области хвоста далеки от идеальных 0,025 независимо от того, какой метод начальной загрузки вы используете в R: require(boot) n <- 25 B <- 1000 nsim <- 1000 set.seed(1) which <- …

2
Как построить 95% доверительный интервал разницы между медианами?
Моя проблема: параллельное групповое рандомизированное исследование с очень искаженным распределением первичного результата. Я не хочу предполагать нормальность и использовать 95% ДИ, основанные на норме (то есть, используя 1,96 X SE). Мне удобно выражать меру центральной тенденции как медиану, но мой вопрос заключается в том, как построить 95% -е ДИ разницы …

4
Как определить, симметрично ли распределение данных?
Я знаю, что если медиана и среднее значение приблизительно равны, то это означает, что существует симметричное распределение, но в данном конкретном случае я не уверен. Среднее значение и медиана довольно близки (разница составляет всего 0,487 м / галл), что заставляет меня сказать, что существует симметричное распределение, но, глядя на коробочный …

4
Почему среднее значение более стабильно в разных выборках, чем в среднем?
Раздел 1.7.2 Обнаружения Статистики Используя R Энди Филдсом и др., Перечисляя достоинства среднего значения по отношению к медиане, утверждает: ... среднее значение стабильно в разных выборках. Это после объяснения многих достоинств медианы, например, ... Медиана относительно не зависит от экстремальных показателей на обоих концах распределения ... Учитывая, что медиана относительно …
22 mean  median 

2
Можно ли накапливать набор статистических данных, описывающих большое количество образцов, чтобы я мог затем создать коробочный график?
Я должен немедленно уточнить, что я являюсь практикующим разработчиком программного обеспечения, а не статистиком, и что мой класс по статистике в колледже был очень давно ... Тем не менее, я хотел бы знать, существует ли метод для накопления набора описательной статистики, который затем может быть использован для создания коробочного графика, …

1
Когда средняя статистика является достаточной статистикой?
Я натолкнулся на замечание в The Chemical Statistician, что выборочная медиана часто может быть выбором для достаточной статистики, но, помимо очевидного случая одного или двух наблюдений, когда он равен среднему значению выборки, я не могу думать о другой нетривиальной случай, когда выборка медиана достаточно.

4
Как спроецировать новый вектор на пространство PCA?
После выполнения анализа главных компонентов (PCA) я хочу спроецировать новый вектор на пространство PCA (т.е. найти его координаты в системе координат PCA). Я рассчитал PCA на языке R, используя prcomp. Теперь я должен быть в состоянии умножить свой вектор на матрицу вращения PCA. Должны ли главные компоненты в этой матрице …
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.