Меня интересует определение квартиля, которое обычно используется, когда вы занимаетесь базовой статистикой. У меня есть книга типа Stat 101, и она просто дает интуитивное определение. «Около четверти данных приходится на первый квартиль или ниже ...» Но он дает пример, в котором он вычисляет Q1, Q2 и Q3 для набора данных.
5, 7, 9, 10, 11, 13, 14, 15, 16, 17, 18, 18, 20, 21, 37
Поскольку существует 15 фрагментов данных, в качестве медианы выбирается 15, Q2. Затем он разделяет оставшиеся данные на две половины, с 5 по 14 и с 16 по 37. Каждая из них содержит 7 частей данных, и они находят медиану каждого из этих наборов, 10 и 18, как Q1 и Q3, соответственно. Вот как бы я сам это вычислил.
Я посмотрел на статью в Википедии, и она дает 2 метода. Один согласен с вышеизложенным, а другой говорит, что вы могли бы также включить медиану 15 в оба набора (но вы не включили бы медиану, если бы она была средним из двух средних чисел в случае четного числа точек данных). Это все имеет смысл для меня.
Но затем я проверил Excel, чтобы увидеть, как Excel вычисляет его. Я использую Excel 2010, который имеет 3 разные функции. Quartile был доступен в 2007 году и предыдущих версиях. Кажется, они хотят, чтобы вы прекратили использовать это в 2010 году, но он все еще доступен. Quartile.Inc является новым, но, насколько я могу судить, полностью согласен с Quartile. И есть Quartile.Exc также. Я считаю, что оба последних 2 являются новыми в 2010 году. На этот раз я только что попытался использовать целые числа 1, 2, 3, ..., 10. Я ожидаю, что Excel даст медиану 5,5, Q1 из 3 и Q3 из 8. Метод также из книги статистики. поскольку оба метода в Википедии дадут эти ответы, так как медиана - это среднее от средних двух чисел. Excel дает
quartile number, Quartile.Inc, Quartile.Exc
1, 3.25, 2.75
2, 5.5, 5.5
3, 7.75, 8.25
Ни один из них не согласен с тем, о чем я ранее говорил.
Описания в файле справки для Excel:
Quartile.Inc - возвращает квартиль набора данных на основе значений процентиля от 0..1 включительно.
Quartile.Exc - возвращает квартиль набора данных, основанный на значениях процентиля от 0..1, исключая.
Может ли кто-нибудь помочь мне понять это определение, которое использует Excel?