Центральная тенденция, распространение и асимметрия могут быть определены относительно хорошо, по крайней мере, на интуитивной основе; стандартные математические меры этих вещей также относительно хорошо соответствуют нашим интуитивным представлениям. Но куртоз кажется другим. Это очень сбивает с толку и не очень хорошо вписывается в интуицию о форме распределения.
Типичным объяснением эксцесса в прикладной обстановке будет следующий фрагмент Прикладной статистики для бизнеса и управления с использованием Microsoft Excel [ 1 ] :
Куртоз относится к тому, насколько пиковым является распределение или, наоборот, насколько оно плоское. Если в хвостах больше значений данных, чем вы ожидаете от нормального распределения, эксцесс будет положительным. И наоборот, если в хвостах меньше значений данных, чем вы ожидаете при нормальном распределении, эксцесс является отрицательным. Excel не может рассчитать эту статистику, если у вас есть как минимум четыре значения данных.
Помимо путаницы между "куртозом" и "избыточным куртозом" (как в этой книге, часто используется первое слово для обозначения того, что другие авторы называют последним), интерпретация в терминах "остроконечности" или "плоскостности" затем переключается на переключение внимания на количество элементов данных в хвостах. Считать нужно и «пик», и «хвост» - Капланский [ 2 ]в 1945 г. жаловался на то, что во многих учебниках того времени ошибочно указывалось, что куртоз связан с тем, насколько высок пик распределения по сравнению с пиком нормального распределения без учета хвостов. Но очевидно, что необходимость учитывать форму как на вершине, так и на хвостах затрудняет постижение интуиции, точка, упомянутая выше, пропускается, переходя от пика к тяжести хвоста, как если бы эти концепции были одинаковыми.
Более того, это классическое объяснение эксцесса «пика и хвоста» хорошо работает только для симметричных и унимодальных распределений (действительно, все иллюстрированные примеры в этом тексте симметричны). Тем не менее, «правильный» общий способ интерпретации куртоза, будь то «пики», «хвосты» или «плечи», обсуждался десятилетиями . [ 2 ] [ 3 ] [ 4 ] [ 5 ] [ 6 ]
Существует ли интуитивно понятный способ обучения куртозу в прикладной обстановке, который не приведет к противоречиям или контрпримерам при более строгом подходе? Является ли эксцесс вообще полезной концепцией в контексте таких курсов прикладного анализа данных, в отличие от классов математической статистики? Если «пик» распределения является интуитивно полезным понятием, следует ли нам учить его посредством L-моментов [ 7 ] ?
Херкенхофф Л. и Фогли Дж. (2013). Прикладная статистика для бизнеса и управления с использованием Microsoft Excel. Нью-Йорк, штат Нью-Йорк: Springer.
Капланский И. (1945). «Распространенная ошибка, связанная с куртозом». Журнал Американской статистической ассоциации,40(230): 259.
Дарлингтон, Ричард Б. (1970). "Куртоз - это действительно" пик "?" Американский статистик24(2): 19–22
мавры, JJA. (1986) «Значение куртоза: Дарлингтон пересмотрел». Американский статистик40(4): 283–284
Баланда, Кевин П. и МакГилливрей, Х.Л. (1988). "Куртоз: критическое обозрение". Американский статистик 42(2): 111–119
DeCarlo, LT (1997). «О значении и использовании куртоза». Психологические методы,2(3), 292. Чикаго
Хоскинг, JRM (1992). «Моменты или L моменты? Пример, сравнивающий две меры формы распределения». Американский статистик46(3): 186–189