Вопросы с тегом «descriptive-statistics»

Описательные статистические данные суммируют особенности выборки, такие как среднее и стандартное отклонения, медиана и квартили, максимум и минимум. С несколькими переменными, могут включать корреляции и кросс-таблицы. Может включать в себя визуальные отображения - графы, гистограммы, диаграммы рассеяния и так далее.

1
Как найти 95% вероятный интервал?
Я пытаюсь вычислить 95% вероятный интервал следующего апостериорного распределения. Я не смог найти функцию в R для нее, но правильный ли подход ниже? x <- seq(0.4,12,0.4) px <- c(0,0, 0, 0, 0, 0, 0.0002, 0.0037, 0.018, 0.06, 0.22 ,0.43, 0.64,0.7579, 0.7870, 0.72, 0.555, 0.37, 0.24, 0.11, 0.07, 0.02, 0.009, 0.005, …

2
Коэффициент Кости такой же, как точность?
Я сталкиваюсь с коэффициентом Кости для сходства объема ( https://en.wikipedia.org/wiki/S%C3%B8rensen%E2%80%93Dice_coefficient ) и точности ( https://en.wikipedia.org/wiki/Accuracy_and_precision ). Мне кажется, что эти две меры одинаковы. Какие-нибудь мысли?

1
Если распределение тестовой статистики является бимодальным, означает ли p-значение что-либо?
Р-значение определяется вероятностью получения тест-статистики, по крайней мере, такой же экстремальной, как и наблюдаемая, при условии, что нулевая гипотеза верна. Другими словами, P(X≥t|H0)P(X≥t|H0)P( X \ge t | H_0 ) Но что если тест-статистика является бимодальной по распределению? означает ли p-значение что-либо в этом контексте? Например, я собираюсь смоделировать некоторые бимодальные …

2
Статистика пиццы для масс
Короткая запись на сайте NY Times содержит факты и цифры потребления пиццы в Соединенных Штатах. Меня интересует, как статистика используется (или злоупотребляется) для предоставления информации широкой аудитории, и на основе представленной статистики возникло несколько вопросов: Если 1 из 8 американцев будет есть пиццу сегодня, значит ли это, что средний американец …

6
Надежная (непараметрическая) мера, такая как коэффициент вариации - IQR / медиана или альтернатива?
Для данного набора данных разброс часто рассчитывается либо как стандартное отклонение, либо как IQR (межквартильный диапазон). Принимая во внимание, что a standard deviationнормализовано (z-показатели и т. Д.), И поэтому его можно использовать для сравнения разброса по двум различным популяциям, это не относится к IQR, поскольку выборки из двух разных популяций …

2
Как оценить третий квартиль бин-данных?
Есть ли какая-то техническая хитрость для определения третьего квартиля, если он принадлежит открытому интервалу, который содержит более четверти населения (поэтому я не могу закрыть интервал и использовать стандартную формулу)? редактировать В случае, если я что-то неправильно понял, я предоставлю более или менее полный контекст. У меня есть данные, расположенные в …

3
Разница сводная статистика: коэффициент Джини и стандартное отклонение
Есть несколько сводных статистических данных. Если вы хотите описать разброс распределения, вы можете использовать, например, стандартное отклонение или коэффициент Джини . Я знаю, что стандартное отклонение основано на центральной тенденции, то есть отклонении от среднего, а коэффициент Джини является общим измерением дисперсии. Я также знаю, что коэффициент Джини имеет нижнюю …

4
Использование децибел в статистике
Я работаю над проектом, который включает чтение меток RFID и сравнение уровня сигнала, который читатель видит при изменении конфигурации антенны (количество антенн, положение и т. Д.). Как часть проекта, мне нужно сравнить настройки, чтобы увидеть, какие из них наиболее эффективны. В идеале я мог бы выполнить либо непарный t-тест, либо …

3
Результаты построения графиков, имеющие только среднее значение и стандартное отклонение
Я пытаюсь визуализировать соответствующий график для наблюдений в этой таблице средних значений и стандартных отклонений оценок отзыва: ОтзывконтрольЖадный37SD8экспериментальныйЖадный21SD6ControlExperimentalMeanSDMeanSDRecall378216\begin{array} {c|c c|c c|} & \text{Control} & & \text{Experimental} & \\ & \text{Mean} & \text{SD} &\text{Mean} &\text{SD} \\ \hline \text{Recall} & 37 & 8 & 21 & 6 \\ \hline \end{array} Каков наилучший …

2
Сюжет QQ в Python
Я создал график qq, используя следующий код. Я знаю, что qq plot используется для проверки нормального распределения данных. Мой вопрос заключается в том, что обозначения осей x и y указывают на графике qq и что означает это значение квадрата r? N = 1200 p = 0.53 q = 1000 obs …

5
«Пик» перекошенной функции плотности вероятности
Я хотел бы описать «пиковость» и «тяжесть хвоста» нескольких искаженных функций плотности вероятности. Особенности, которые я хочу описать, будут ли они называться «куртозом»? Я видел только слово "эксцесс", используемое для симметричных распределений?

1
Найти сопоставимую контрольную группу для группы лечения?
У меня есть группа лечения размером 30 (30 школ в Калифорнии), которая использовала дополнительное математическое программное обеспечение. В простом анализе я хотел бы сравнить средний рост математики учащихся между нашей группой лечения и сопоставимой контрольной группой. Есть много школ в CA, которые не использовали программное обеспечение. Я бы хотел, чтобы …

5
Объясняя среднее, медиану, моду в терминах непрофессионала
Как бы вы объяснили понятие среднего, медианы и формы списка чисел и почему они важны для человека, обладающего только базовыми арифметическими навыками? Не будем упоминать асимметрию, CLT, центральную тенденцию, их статистические свойства и т. Д. Я объяснил кому-то, что это просто быстрый и грязный способ «суммировать» список чисел. Но, оглядываясь …

3
glm в R - какое значение pvalue соответствует качеству подгонки всей модели?
Я бегу glms в R (обобщенные линейные модели). Я думал, что знаю значения pvalue - пока не увидел, что вызов сводки для glm не дает вам превосходящего pvalue представителя модели в целом - по крайней мере, не там, где это делают линейные модели. Мне интересно, если это дано как значение …

2
Почему коэффициент вариации недопустим при использовании данных с положительными и отрицательными значениями?
Я не могу найти окончательный ответ на мой вопрос. Мои данные состоят из нескольких графиков с измеренными средними значениями от 0,27 до 0,57. В моем случае все значения данных положительные, но само измерение основано на соотношении значений отражательной способности, которое может варьироваться от -1 до +1. Графики представляют значения NDVI …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.