Вопросы с тегом «descriptive-statistics»

Описательные статистические данные суммируют особенности выборки, такие как среднее и стандартное отклонения, медиана и квартили, максимум и минимум. С несколькими переменными, могут включать корреляции и кросс-таблицы. Может включать в себя визуальные отображения - графы, гистограммы, диаграммы рассеяния и так далее.

12
Инструмент командной строки для расчета базовой статистики для потока значений [закрыто]
Закрыто. Этот вопрос не по теме . В настоящее время не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто в прошлом году . Существует ли какой-либо инструмент командной строки, который принимает поток чисел (в формате ascii) из стандартного ввода и предоставляет основную описательную …

3
Что можно сделать вывод о данных, когда среднее арифметическое очень близко к среднему геометрическому?
Есть ли что-то существенное в среднем геометрическом и среднем арифметическом значении, которое находится очень близко друг к другу, скажем, ~ 0,1%? Какие предположения можно сделать о таком наборе данных? Я работал над анализом набора данных и заметил, что по иронии судьбы значения очень и очень близки. Не точно, но близко. …

5
Важен ли исследовательский анализ данных при чисто прогностическом моделировании?
При построении прогностической модели с использованием методов машинного обучения, какой смысл проводить исследовательский анализ данных (EDA)? Можно ли сразу перейти к генерации объектов и созданию вашей модели? Как важна описательная статистика, используемая в EDA?


4
Какой смысл сообщать описательную статистику?
Я только что провел анализ своих данных с использованием логистической регрессии, однако мне также необходимо иметь описательную часть статистики в моем отчете. Я, честно говоря, не вижу в этом смысла, и я надеялся, что кто-то сможет объяснить, почему это необходимо. Например, если я строю гистограмму одной из моих независимых непрерывных …

1
Подобные Anscombe наборы данных с одним и тем же блоком и графиком усов (среднее / стандартное / медианное / MAD / мин / макс)
РЕДАКТИРОВАТЬ: Поскольку этот вопрос был завышен, краткое изложение: поиск различных значимых и интерпретируемых наборов данных с одинаковой смешанной статистикой (среднее значение, медиана, средний диапазон и связанные с ними дисперсии и регрессия). Квартет Анскомба (см. « Цель визуализации высокоразмерных данных?» ) Является известным примером четырех наборов данных ИксИксx - YYy с …

6
В чем разница между описательной и логической статистикой?
Насколько я понимаю, описательная статистика количественно описывает особенности выборки данных, в то время как логическая статистика делает выводы о группах населения, из которых были взяты выборки. Тем не менее, страница Википедии для статистического вывода состояний: По большей части статистический вывод делает предположения о популяциях, используя данные, взятые из интересующей популяции …

4
Что означает «беспристрастность»?
Что значит сказать, что «дисперсия является необъективной оценкой». Что означает преобразование смещенной оценки в несмещенную оценку с помощью простой формулы. Что именно делает это преобразование? Кроме того, какова практическая польза от этого преобразования? Вы конвертируете эти баллы при использовании определенного вида статистики?

2
Расчет стандартной ошибки после лог-преобразования
Рассмотрим случайный набор чисел, которые обычно распределяются: x <- rnorm(n=1000, mean=10) Нам бы хотелось знать среднее и стандартную ошибку на среднем, поэтому мы делаем следующее: se <- function(x) { sd(x)/sqrt(length(x)) } mean(x) # something near 10.0 units se(x) # something near 0.03 units Большой! Однако, давайте предположим, что мы не …

3
Как я могу рассчитать доверительный интервал среднего значения в ненормально распределенной выборке?
Как я могу рассчитать доверительный интервал среднего значения в ненормально распределенной выборке? Я понимаю, что здесь часто используются методы начальной загрузки, но я открыт для других вариантов. В то время как я ищу непараметрическую опцию, если кто-то может убедить меня, что параметрическое решение является действительным, это было бы хорошо. Размер …

5
Интуиция (геометрическая или другая) из
Рассмотрим элементарную идентичность дисперсии: Var(X)===E[(X−E[X])2]...E[X2]−(E[X])2Var(X)=E[(X−E[X])2]=...=E[X2]−(E[X])2 \begin{eqnarray} Var(X) &=& E[(X - E[X])^2]\\ &=& ...\\ &=& E[X^2] - (E[X])^2 \end{eqnarray} Это простая алгебраическая манипуляция с определением центрального момента в нецентральные моменты. Это позволяет удобно манипулировать в других контекстах. Это также позволяет вычислить дисперсию с помощью одного прохода данных, а не двух проходов, …

4
Нетранзитивность корреляции: корреляция между полом и размером мозга и между размером мозга и IQ, но нет корреляции между полом и IQ
Я нашел следующее объяснение в блоге и хотел бы получить больше информации о нетранзитивности корреляции: У нас есть следующие неоспоримые факты: В среднем, разница в объеме мозга у мужчин и женщин Существует корреляция между IQ и размером мозга; корреляция составляет 0,33 и, таким образом, соответствует 10% изменчивости IQ Из этих …

5
Какую сводную статистику использовать с категориальными или качественными переменными?
Просто чтобы уточнить, когда я имею в виду сводную статистику, я имею в виду среднее значение, диапазоны среднего квартиля, дисперсию, стандартное отклонение. Имеет ли смысл найти среднее значение, медиану, квартильный диапазон, дисперсию и стандартное отклонение при суммировании одномерного, категориального или качественного , с учетом как номинального, так и ординального случаев? …


3
В чем разница между «статистическим экспериментом» и «статистической моделью»?
Я слежу за А. В. ван дер Ваартом за асимптотической статистикой (1998). Он говорит о статистических экспериментах, утверждая, что они отличаются от статистической модели, но он не определяет ни того, ни другого. Мой вопрос: Что такое (1) статистический эксперимент, (2) статистическая модель и (3) какой ключевой компонент всегда делает статистический …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.