Вопросы с тегом «data-visualization»

Построение значимых и полезных графических представлений данных. (Если ваш вопрос только о том, как заставить определенное программное обеспечение производить определенный эффект, то, скорее всего, это не по теме.)

8
Функция графического обзора данных (сводная) в R
Я уверен, что раньше я сталкивался с подобной функцией в пакете R, но после интенсивного поиска в Google я, кажется, нигде не могу ее найти. Функция, о которой я думаю, создала графическое резюме для заданной ей переменной, создавая вывод с некоторыми графиками (гистограммой и, возможно, графиком с усами) и некоторым …

4
Нужно ли изучать ggplot2 или ggvis?
Нужно ли изучать ggplot2 или ggvis? Я не обязательно хочу изучать оба, если один из них превосходит в любом отношении. Почему сообщество R продолжает создавать новые пакеты с перекрывающимися функциями? В вводном посте не упоминается слово, почему ggvis создан, поскольку сложный пакет для построения графиков ggplot2 уже существует.

3
Будет ли PCA работать для логических (двоичных) типов данных?
Я хочу уменьшить размерность систем более высокого порядка и захватить большую часть ковариации предпочтительно в двухмерном или одномерном поле. Я понимаю, что это можно сделать с помощью анализа основных компонентов, и я использовал PCA во многих сценариях. Однако я никогда не использовал его с логическими типами данных, и мне было …

5
Как визуализировать / понять, что делает нейронная сеть?
Нейронные сети часто рассматриваются как «черные ящики» из-за их сложной структуры. Это не идеально, так как часто полезно иметь интуитивное представление о том, как модель работает внутри. Каковы методы визуализации работы обученной нейронной сети? В качестве альтернативы, как мы можем извлечь легко усваиваемые описания сети (например, этот скрытый узел в …

2
Когда t-SNE вводит в заблуждение?
Цитата одного из авторов: t-распределенное стохастическое вложение соседей (t-SNE) - это ( выигрышный ) метод уменьшения размерности, который особенно хорошо подходит для визуализации многомерных наборов данных. Это звучит довольно здорово, но об этом говорит автор. Еще одна цитата автора (относительно вышеупомянутого конкурса): Что вы отобрали у этого конкурса? Всегда сначала …

3
Экспериментальные данные, подтверждающие визуализации в стиле Tufte?
Вопрос: Существуют ли экспериментальные данные в поддержку минималистских визуализаций, основанных на данных, в стиле Tufte, по сравнению с визуализированными диаграммой визуализациями, скажем, Найджела Холмса ? Я спросил , как добавить диаграмму-мусор на R участки здесь и ответчики бросили здоровенное количество Снарка на меня. Так что, безусловно, должны быть некоторые экспериментальные …

4
Как интерпретировать среднее значение силуэта?
Я пытаюсь использовать силуэт графика, чтобы определить количество кластеров в моем наборе данных. Учитывая набор данных Train , я использовал следующий код Matlab Train_data = full(Train); Result = []; for num_of_cluster = 1:20 centroid = kmeans(Train_data,num_of_cluster,'distance','sqeuclid'); s = silhouette(Train_data,centroid,'sqeuclid'); Result = [ Result; num_of_cluster mean(s)]; end plot( Result(:,1),Result(:,2),'r*-.');` Результирующий график …

3
Почему существует разница между ручным вычислением 95-процентного доверительного интервала и использованием функции confint () в R?
Дорогие, я заметил нечто странное, что не могу объяснить, не так ли? В итоге: ручной подход к вычислению доверительного интервала в модели логистической регрессии и функция R confint()дают разные результаты. Я проходил Прикладную логистическую регрессию Хосмера и Лемешоу (2-е издание). В 3-й главе приведен пример расчета отношения шансов и 95% …
34 r  regression  logistic  confidence-interval  profile-likelihood  correlation  mcmc  error  mixture  measurement  data-augmentation  r  logistic  goodness-of-fit  r  time-series  exponential  descriptive-statistics  average  expected-value  data-visualization  anova  teaching  hypothesis-testing  multivariate-analysis  r  r  mixed-model  clustering  categorical-data  unsupervised-learning  r  logistic  anova  binomial  estimation  variance  expected-value  r  r  anova  mixed-model  multiple-comparisons  repeated-measures  project-management  r  poisson-distribution  control-chart  project-management  regression  residuals  r  distributions  data-visualization  r  unbiased-estimator  kurtosis  expected-value  regression  spss  meta-analysis  r  censoring  regression  classification  data-mining  mixture 

2
Существует ли вариант коробчатого графика для распределенных данных Пуассона?
Я хотел бы знать, есть ли вариант коробочного графика, адаптированный к распределенным данным Пуассона (или, возможно, другим дистрибутивам)? При гауссовском распределении, с усами, расположенными при L = Q1 - 1,5 IQR и U = Q3 + 1,5 IQR, у боксплотта есть свойство, что будет примерно столько же низких выбросов (точек …

3
Наборы данных, построенные с целью, аналогичной таковой в квартете Анскомба
Я только что натолкнулся на квартет Анскомба (четыре набора данных, которые имеют почти неразличимую описательную статистику, но выглядят совсем иначе при построении графика), и мне любопытно, есть ли другие более или менее известные наборы данных, которые были созданы, чтобы продемонстрировать важность определенных аспектов статистического анализа.

2
Выполнение статистического теста после визуализации данных - выемка данных?
Я предложу этот вопрос на примере. Предположим, у меня есть набор данных, такой как набор данных по ценам на жилье в Бостоне, в котором у меня есть непрерывные и категориальные переменные. Здесь у нас есть переменная «качество», от 1 до 10, и цена продажи. Я могу разделить данные на дома …

5
Рекомендации по цвету и толщине линий для линейных участков
Много было написано о выборе цвета, удобного для слепых, для карт, полигонов и заштрихованных областей в целом (см., Например, http://colorbrewer2.org ). Мне не удалось найти рекомендации по цветам линий и различной толщине линий для линейных графиков. Цели: легко различать линии, даже когда они переплетаются Линии легко различить по лицам с …

2
Как построить границу решения классификатора k-ближайшего соседа из элементов статистического обучения?
Я хочу создать сюжет, описанный в книге ElemStatLearn «Элементы статистического обучения: сбор данных, вывод и прогноз. Второе издание» Тревора Хасти, Роберта Тибширани и Джерома Фридмана. Сюжет: Мне интересно, как я могу получить этот точный график R, особенно обратите внимание на графику сетки и расчеты, чтобы показать границу.

3
Визуализация миллиона, выпуск PCA
Можно ли визуализировать результаты анализа основных компонентов способами, которые дают больше понимания, чем просто сводные таблицы? Возможно ли это сделать, когда число наблюдений велико, скажем, ~ 1e4? И возможно ли это сделать в R [приветствуются другие среды]?

8
Инструменты с открытым исходным кодом для визуализации многомерных данных?
Помимо gnuplot и ggobi , какие инструменты с открытым исходным кодом люди используют для визуализации многомерных данных? Gnuplot - более или менее базовый пакет для построения графиков. Ггоби может сделать несколько изящных вещей, таких как: анимировать данные вдоль измерения или среди дискретных коллекций одушевленные линейные комбинации, меняющие коэффициенты вычислить основные …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.