Вопросы с тегом «data-visualization»

Построение значимых и полезных графических представлений данных. (Если ваш вопрос только о том, как заставить определенное программное обеспечение производить определенный эффект, то, скорее всего, это не по теме.)

4
Как визуализировать два независимых t-критерия?
Каковы наиболее приемлемые способы визуализации результатов независимого двух-выборочного t-теста? Чаще всего используется числовая таблица или какой-то сюжет? Цель состоит в том, чтобы случайный наблюдатель посмотрел на фигуру и сразу увидел, что они, вероятно, из двух разных групп населения.

6
Как уменьшить количество точек данных в серии?
Я не изучал статистику более 10 лет (а затем просто базовый курс), поэтому, возможно, мой вопрос немного сложен для понимания. В любом случае, я хочу уменьшить количество точек данных в серии. Ось X - это количество миллисекунд с начала измерения, а ось Y - показание для этой точки. Часто есть …

2
Охватывает ли парадокс Симпсона все случаи обращения из скрытой переменной?
Ниже приводится вопрос о множестве визуализаций, предлагаемых в качестве «доказательства по картинке» о существовании парадокса Симпсона, и, возможно, вопрос о терминологии. Парадокс Симпсона - довольно простое явление, которое можно описать и привести числовые примеры (причина, по которой это может произойти, глубока и интересна). Парадокс заключается в том, что существуют таблицы …

1
Боксовые выемки против интервала Тьюки-Крамера
«Зарубка» помощь документ ( или исходный текст ) из boxplot в «R» дает следующее: Если выемки на двух участках не перекрываются, это является «убедительным доказательством» того, что две медианы различаются (Chambers et al, 1983, p. 62). Смотрите boxplot.stats для используемых расчетов. и « boxplot.stats » дает следующее: Пазы (если требуется) …

1
Построение прогнозных значений во временных рядах ARIMA в R
Вероятно, в этом вопросе есть несколько серьезных недоразумений, но это не означает, что вычисления правильны, а скорее мотивируют изучение временных рядов с некоторым вниманием. Пытаясь понять применение временных рядов, кажется, что удаление данных делает прогноз будущих значений неправдоподобным. Например, gtempвременной ряд из astsaпакета выглядит так: Тенденция к росту в последние …

2
Как называется этот тип графика с центрированными горизонтальными столбцами плотности?
Как бы вы назвали этот тип сюжета, и возможно ли его создать в R? РЕДАКТИРОВАТЬ: большое спасибо всем - очень полезно. Лучший титул на данный момент: квантовые сюжеты для скрипки!

1
Что подразумевается под PCA, сохраняя только большие попарные расстояния?
В настоящее время я читаю технику визуализации t-SNE, и было упомянуто, что одним из недостатков использования анализа главных компонентов (PCA) для визуализации многомерных данных является то, что он сохраняет только большие попарные расстояния между точками. Значимые точки, которые находятся далеко друг от друга в многомерном пространстве, также будут появляться далеко …

1
Разъяснения относительно чтения номограммы
Ниже приведена номограмма, созданная из набора данных mtcars с пакетом rms для формулы: mpg ~ wt + am + qsec Сама модель кажется хорошей с R2 0,85 и P <0,00001 > mod Linear Regression Model ols(formula = mpg ~ wt + am + qsec, data = mtcars) Model Likelihood Discrimination …

3
Подход и пример кластеризации графов в «R»
Я ищу, чтобы сгруппировать / объединить узлы в графе, используя кластеризацию графа в 'r'. Вот потрясающе игрушечный вариант моей проблемы. Есть два "кластера" Существует «мост», соединяющий кластеры Вот сеть-кандидат: Когда я смотрю на расстояние соединения, "hopcount", если хотите, то я могу получить следующую матрицу: mymatrix <- rbind( c(1,1,2,3,3,3,2,1,1,1), c(1,1,1,2,2,2,1,1,1,1), c(2,1,1,1,1,1,1,1,2,2), …

2
Как визуализировать проценты по сравнению с количеством записей.
Я пытаюсь найти лучший способ визуализировать приведенную ниже таблицу и подчеркнуть эффективность лечения в сравнении с количеством пациентов, которые попробовали лечение. Вот ссылка на реальную страницу: http://curetogether.com/cluster-headaches/treatments/ Каков наилучший способ подчеркнуть эффективность, в то же время упрощая сравнение процедур и определение количества пациентов, оцениваемых каждым? Моя мысль состояла в том, …

3
Как извлечь информацию из матрицы графика рассеяния, когда у вас большое N, дискретные данные и много переменных?
Я играю с набором данных о раке молочной железы и создал диаграмму рассеяния всех атрибутов, чтобы понять, какие из них оказывают наибольшее влияние на предсказание класса malignant(синий) benign(красный). Я понимаю, что строка представляет ось x, а столбец представляет ось y, но я не вижу, какие наблюдения я могу сделать относительно …

1
Визуализация многих искаженных распределений
У меня есть серия дистрибутивов с левосторонним и тяжелым хвостом, которые я хотел бы показать. Есть 42 распределения через три фактора (помечено как A, Bи Cниже). Кроме того, изменение сокращается через фактор B. У меня проблема в том, что распределение трудно дифференцировать по шкале результата (соотношение или кратное изменение): Регистрация …

2
Составление сводной статистики со средним, сд, мин и макс?
Я из области экономики и обычно в дисциплине сводная статистика переменных представлена ​​в таблице. Тем не менее, я хочу построить их. Я мог бы изменить коробчатый график так, чтобы он отображал среднее, стандартное отклонение, минимум и максимум, но я не хочу этого делать, поскольку прямоугольные диаграммы традиционно используются для отображения …

2
Исследование матрицы рассеяния для многих переменных
Я анализирую набор данных со многими параметрами (скажем, 50-200), и мне интересно посмотреть на связи между переменными (например, с точки зрения диаграмм рассеяния с 2 переменными или гистограмм 2d). Однако для этого количества параметров кажется невозможным нарисовать массив графиков 200х200 (если я не распечатал его и не повесил на стену). …

3
Как визуализировать байесовскую доброту, пригодную для логистической регрессии
Для задачи байесовской логистической регрессии я создал апостериорное предиктивное распределение. Я выбираю из прогнозирующего распределения и получаю тысячи выборок (0,1) для каждого наблюдения, которое у меня есть. Визуализация пригодности менее интересна, например: На этом графике показаны 10 000 образцов + наблюдаемая исходная точка (слева можно разглядеть красную линию: да, это …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.