Есть ли «привет, мир» для статистической графики?


26

В компьютерном программировании существует классическая первая программа для изучения / преподавания нового языка или системы, называемая «привет, мир». http://en.wikipedia.org/wiki/Hello_world_program

Существует ли классическая первая визуализация данных для использования графического пакета? Если так, то, что это? А если нет, то какими будут хорошие кандидаты?


3
Добро пожаловать на наш сайт! Наши часто задаваемые вопросы спрашивают: «Вы должны задавать практические, отвечающие на вопросы вопросы, основанные на реальных проблемах, с которыми вы сталкиваетесь» Не могли бы вы уточнить, в чем ваша проблема?
whuber

3
Я хотел бы определить «стандартный тестовый элемент» для статистической графики, если таковой существует, для включения в учебный материал, который я разрабатываю.
Авраам Д. Ленчман

2
Поскольку графические приложения сильно различаются, трудно представить какую-либо стандартную или универсальную графику. Там являются некоторые стандарты для определенных типов Graphing пакетов, таких как исторически известных кроликами и чайники для 3D - графики. Чтобы ваш вопрос был подотчетным, было бы полезно более конкретно указать, на какой пакет (ы) будут направлены ваши учебные материалы.
whuber

1
Хороший вопрос, спасибо. Я включу хотя бы кое-что о статистической графике в R, STATA, Python и Javascript.
Авраам Д. Ленчман

@AbrahamDFlaxman Мне интересно узнать об этом "учебном материале", а также о том, для кого и для чего он предназначен. Можешь сказать больше?
Питер Флом - Восстановить Монику

Ответы:


9

Две мысли:

О. Когда я пытаюсь понять суть «Hello World», это минимум, который должен быть сделан на языке программирования, чтобы сгенерировать правильную программу, которая печатает одну строку текста. Это наводит меня на мысль, что ваш «Hello World» должен быть одномерным набором данных, самой простой вещью, которую вы можете подключить к статистической или графической программе.

Б. Я не знаю ни одного графика "Hello World". Самое близкое, что я могу найти, - это типичные наборы данных, которые включены в различные статистические пакеты, такие как AirPassengers R. В R графическое выражение Hello World будет:

plot (AirPassengers)  # Base graphics, prints line graph

или

qplot (AirPassengers) # ggplot2, prints a bar chart

или

xyplot (AirPassengers) # lattice, which doesn't have a generic plot

Лично я думаю, что самый простой график - это линейный график, где у вас есть N элементов в Y и X колеблется от 1: N. Но это не стандарт.


2
Консенсус из этого и других ответов заключается в том, что в настоящее время нет «здравствуй, мира» статистической графики. Я думаю, что ваше предложение об одномерном наборе данных с N элементами в Y и X в диапазоне от 1: N является убедительным. В дальнейшей аналогии с «здравствуйте, мир» было бы неплохо иметь маленький N и запоминающийся Y. Что вы думаете о N = 5 и Y = (3,1,4,1,5,9) (т.е. цифры пи)? Может быть, это слишком математично.
Авраам Д. Ленчман

1
@AbrahamDFlaxman: Я не думаю, что это математика, я думаю, что это здорово. Памятный, короткий, и график - это не просто прямая линия или что-то еще. Данные общеизвестны и не привязаны к какой-либо конкретной программе, и могут быть произвольно расширены любым желающим получить больше очков. Я голосую за это!
Уэйн

24

Я, вероятно, начну с диаграмм рассеяния и продемонстрирую четыре некрасивых корреляции .


2
+1. Но вы можете рассмотреть что-то более общее, например, некоторую форму линейного сюжета. В конце концов, как только вы сможете нарисовать отрезок, вы можете нарисовать что угодно . Это перекликается с идеей «Hello, world!»: Как только вы можете получить читабельный вывод из программы, вы знаете, что можете общаться с компьютером, а все остальное - просто детали :-). (Детали могут быть сложными . При обучении написанию кода сборки для мэйнфрейма IBM 360 самый простой способ получить выходные данные - сохранить его в ОЗУ и создать ошибку в конце выполнения, в результате чего система напечатает шестнадцатеричный дамп ядра. !)
whuber

Я думаю, что квартет Анскомба в целом содержит слишком много, чтобы быть использованным в качестве «привет, мир» статистической графики, но рисунок 1 из его статьи может быть хорошим кандидатом. Однако другие ответы подтверждают необходимость одномерного набора данных, к которому я склоняюсь.
Авраам Д. Ленчман

7

Гистограмма выборки нормально распределенной случайной величины.


Мне нравится, как это выглядело бы, но, возможно, гистограммы требуют больше обработки данных, чем разбросов, и выборка из нормального распределения может отвлекать.
Авраам Д. Ленчман

Я только что заметил, что это первый пример с веб-страницы Matplotlib: matplotlib.org
Авраам Д. Флаксман

5

Я думаю, что ответ «нет». То есть, нет общепринятого ответа на ваш вопрос.

@StasK указывает на график рассеяния.

Но я бы рассмотрел, что plotделает в R: Это зависит от данных!

Можно утверждать, что одномерные статистические данные проще, чем двумерные. Так что ... возможно, самая основная вещь - это гистограмма; или, возможно, барный сюжет; возможно график плотности.

Если точка «Привет, мир!» чтобы показать, что вы можете заставить компьютер делать что-то, тогда я бы сказал, что любой заговор будет делать.


1
Возможно, отсутствие стандартного тестового элемента означает, что вы правы, и более уместно использовать любой график, который является самым простым в демонстрируемой системе. Это затрудняет сравнение, однако.
Авраам Д. Ленчман

5

Не уверен, точно ли это относится к миру приветствия, но в R также есть демоверсии, встроенные во многие пакеты. например

library(graphics)
demo(graphics)

проведет пользователя по базовой графике, доступной в пакете. Просто щелкните мышью по каждому изображению, чтобы пройти основные графические иллюстрации. Всего двумя строчками пользователь знакомится с некоторыми из вдохновляющих возможностей R-графики для статистики.

Соответствующий код для генерации графики отображается в консоли R.

введите описание изображения здесь


2

Я бы сказал, что есть две программы типа «Hello World» для визуализации данных:

Печать («Hello World»): что-то вроде гистограммы нормально распределенной переменной или, возможно, простой диаграммы рассеяния X, Y.

Для чего-то немного более сложного, такого как раздел, в котором берутся принципы Hello World и начинают играть с пользовательским вводом, escape-символами и т. П., Я бы сказал, что это будет работать с набором данных Iris.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.