Вопросы с тегом «skewness»

Асимметрия измеряет (или относится к) степень асимметрии в распределении переменной.

2
Асимметрия логарифма гамма-случайной величины
Рассмотрим гамма случайная величина X∼Γ(α,θ)X∼Γ(α,θ)X\sim\Gamma(\alpha, \theta) . Есть аккуратные формулы для среднего значения, дисперсии и асимметрии: E[X]Var[X]Skewness[X]=αθ=αθ2=1/α⋅E[X]2=2/α−−√E[X]=αθVar⁡[X]=αθ2=1/α⋅E[X]2Skewness⁡[X]=2/α\begin{align} \mathbb E[X]&=\alpha\theta\\ \operatorname{Var}[X]&=\alpha\theta^2=1/\alpha\cdot\mathbb E[X]^2\\ \operatorname{Skewness}[X]&=2/\sqrt{\alpha} \end{align} Теперь рассмотрим лог-преобразованную случайную величину Y=log(X)Y=log⁡(X)Y=\log(X) . Википедия дает формулы для среднего значения и дисперсии: E[Y]Var[Y]=ψ(α)+log(θ)=ψ1(α)E[Y]=ψ(α)+log⁡(θ)Var⁡[Y]=ψ1(α)\begin{align} \mathbb E[Y]&=\psi(\alpha)+\log(\theta)\\ \operatorname{Var}[Y]&=\psi_1(\alpha)\\ \end{align} с помощью функций дигаммы и тригаммы, которые …

7
Почему искаженные данные не предпочтительны для моделирования?
В большинстве случаев, когда люди говорят о преобразованиях переменных (как для предикторов, так и для переменных ответа), они обсуждают способы обработки асимметрии данных (например, преобразование журнала, преобразование Бокса и Кокса и т. Д.). Я не могу понять, почему устранение асимметрии считается такой распространенной передовой практикой? Как асимметрия влияет на производительность …

1
Должен ли я использовать t-тест для сильно искаженных данных? Научное доказательство, пожалуйста?
У меня есть образцы из сильно искаженного (похожего на экспоненциальный дистрибутив) набора данных об участии пользователей (например, количество постов), которые имеют разные размеры (но не менее 200), и я хочу сравнить их среднее значение. Для этого я использую непарные t-тесты с двумя образцами (и t-тесты с коэффициентом Уэлча, когда образцы …

5
Способ генерации коррелированных ненормальных данных
Я заинтересован в поиске метода для генерации коррелированных, ненормальных данных. Таким образом, в идеале это некое распределение, которое принимает в качестве параметра ковариационную (или корреляционную) матрицу и генерирует данные, которые приближаются к ней. Но здесь есть одна загвоздка: метод, который я пытаюсь найти, должен иметь гибкость, чтобы также контролировать его …

4
Следует ли использовать среднее значение при перекосе данных?
Часто вводные тексты по прикладной статистике отличают среднее от медианного (часто в контексте описательной статистики и мотивации суммирования центральной тенденции с использованием среднего, медианного значения и режима), объясняя, что среднее значение чувствительно к выбросам в данных выборки и / или искаженное распределение населения, и это используется в качестве оправдания для …

3
Преобразование крайне искаженных распределений
Предположим, что у меня есть переменная, распределение которой искажено положительно в очень высокой степени, так что взятия бревна будет недостаточно, чтобы привести его в диапазон асимметрии для нормального распределения. Какие у меня варианты на данный момент? Что я могу сделать, чтобы преобразовать переменную в нормальное распределение?

3
Формула замкнутой формы для функции распределения, включая асимметрию и эксцесс?
Есть ли такая формула? Учитывая набор данных, для которых среднее значение, дисперсия, асимметрия и эксцесс известны или могут быть измерены, существует ли единая формула, которую можно использовать для расчета плотности вероятности значения, предположительно полученного из вышеупомянутых данных?

2
Интуиция для моментов о среднем распределении?
Может ли кто-то представить интуицию о том, почему более высокие моменты распределения вероятности , такие как третий и четвертый моменты, соответствуют асимметрии и эксцессу соответственно? В частности, почему отклонение от среднего значения, возведенного в третью или четвертую степень, в конечном итоге переходит в меру асимметрии и эксцесса? Есть ли способ …

11
Является ли нормальное, но сильно искаженное распределение гауссовским?
У меня такой вопрос: как вы думаете, как выглядит распределение времени, проведенного за день на YouTube? Мой ответ таков: он, вероятно, нормально распределен и сильно перекошен. Я ожидаю, что есть один режим, в котором большинство пользователей тратят около некоторого среднего времени, а затем длинный правый хвост, поскольку некоторые пользователи являются …

2
Отклонение от нормального предположения в ANOVA: куртоз или асимметрия важнее?
Прикладные линейные статистические модели Kutner et al. утверждает следующее относительно отклонений от предположения нормальности моделей ANOVA: Куртоз распределения ошибок (более или менее достигший максимума, чем нормальное распределение) является более важным, чем асимметрия распределения с точки зрения влияния на выводы . Я немного озадачен этим утверждением и не смог найти никакой …


2
Что делать, если некоторые моменты времени имеют сильно искаженные отклики, а некоторые нет при повторном измерении?
Как правило, когда встречаются непрерывные, но искаженные показатели результата в продольном дизайне (скажем, с одним эффектом между субъектами), общий подход заключается в преобразовании результата в нормальность. Если ситуация экстремальная, например, с усеченными наблюдениями, можно подумать и использовать модель кривой роста Тобита или что-то подобное. Но я в недоумении, когда вижу …


3
Диапазон значений асимметрии и эксцесса для нормального распределения
Я хочу знать, каков диапазон значений асимметрии и эксцесса, для которых данные считаются нормально распределенными. Я прочитал много аргументов, и в основном я получил смешанные ответы. Некоторые говорят, что асимметрия и для эксцесса является приемлемым диапазоном для нормального распределения. Некоторые говорят для асимметрии является приемлемым диапазоном. Я нашел подробное обсуждение …

5
«Пик» перекошенной функции плотности вероятности
Я хотел бы описать «пиковость» и «тяжесть хвоста» нескольких искаженных функций плотности вероятности. Особенности, которые я хочу описать, будут ли они называться «куртозом»? Я видел только слово "эксцесс", используемое для симметричных распределений?

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.