Я работаю над созданием веб-сайта, который отображает данные переписи для выбранных пользователем полигонов и хотел бы графически показать распределение различных параметров (по одному графику на параметр).
Данные обычно имеют следующие свойства:
- Размер выборки, как правило, большой (скажем, около 10000 точек данных)
- Диапазон значений имеет тенденцию быть достаточно большим (например, минимальная популяция может быть меньше 100, а максимальная может быть примерно 500 000)
- q1 обычно близок к минимуму (скажем, 200), в то время как q2 и q3 будут в пределах 10000
- Это не выглядит как нормальное распределение
Я не статистика и, следовательно, моё описание может быть не совсем ясным.
Я хотел бы показать это распределение на графике, который увидят граждане (если хотите, непрофессионал).
Я бы предпочел использовать гистограмму, но это невозможно из-за большого диапазона значений, из-за которого создание бинов не очень просто и прямолинейно.
Из того, что я мало знаю о статистике, блочный график - это то, что часто используется для отображения такого рода данных, но я чувствую, что для непрофессионала расшифровка блочного графика не легка.
Какие у меня есть варианты, чтобы показать эти данные в доступной для понимания форме?