Вопросы с тегом «data-visualization»

Построение значимых и полезных графических представлений данных. (Если ваш вопрос только о том, как заставить определенное программное обеспечение производить определенный эффект, то, скорее всего, это не по теме.)

3
За каким распространением следуют мои данные?
Допустим, у меня есть 1000 компонентов, и я собираю данные о том, сколько раз они регистрируют сбой, и каждый раз, когда они регистрируют сбой, я также отслеживаю, сколько времени понадобилось моей команде, чтобы устранить проблему. Короче говоря, я записывал время ремонта (в секундах) для каждого из этих 1000 компонентов. Данные …

6
Линейный график имеет слишком много линий, есть ли лучшее решение?
Я пытаюсь составить график количества действий пользователей (в данном случае «лайков») с течением времени. Таким образом, у меня есть «Количество действий» в качестве моей оси Y, моя ось X - время (недели), и каждая строка представляет одного пользователя. Моя проблема в том, что я хочу посмотреть на эти данные около …

7
Статистические методы для более эффективного построения данных, когда присутствуют миллионы точек?
Я считаю, что R может занять много времени для создания графиков, когда присутствуют миллионы точек - неудивительно, учитывая, что точки строятся индивидуально. Кроме того, такие графики часто слишком загромождены и плотны, чтобы быть полезными. Многие из точек перекрываются и образуют черную массу, и много времени тратится на построение большего количества …

3
Какой хороший способ использовать R для создания диаграммы рассеяния, которая разделяет данные по обработке?
Locked . Этот вопрос и его ответы заблокированы, потому что вопрос не по теме, но имеет историческое значение. В настоящее время он не принимает новые ответы или взаимодействия. Я очень плохо знаком с R и статистикой в ​​целом, но мне нужно составить график рассеяния, который, я думаю, может быть за …

4
Оптимизация для кривых Precision-Recall при дисбалансе класса
У меня есть задача классификации, где у меня есть несколько предикторов (один из которых является наиболее информативным), и я использую модель MARS для построения моего классификатора (меня интересует любая простая модель, и использование glms для иллюстративных целей будет тоже хорошо). Теперь у меня огромный дисбаланс классов в данных обучения (около …

2
Интерпретация болтов в анализе главных компонентов
Я наткнулся на этот хороший учебник: Руководство по статистическому анализу с использованием R. Глава 13. Анализ основных компонентов: Олимпийский гепатлон о том, как делать PCA на языке R. Я не понимаю интерпретацию рисунка 13.3: Итак, я строю первый собственный вектор против второго собственного вектора. Что это значит? Предположим, что собственное …

3
Визуализация пересечений множества множеств
Есть ли модель визуализации, которая хороша для отображения пересечения многих множеств? Я думаю что-то вроде диаграмм Венна, но это может как-то подойти для большего числа наборов, таких как 10 или более. Википедия показывает некоторые диаграммы Венна с более высокими наборами, но даже диаграммы с четырьмя наборами - это много, что …

2
Интерпретация сюжета (глм.модель)
Может кто-нибудь сказать мне, как интерпретировать графики «остатки против подгонки», «нормальный q-q», «масштаб-местоположение» и «остатки против плеча»? Я подгоняю биномиальный GLM, сохраняю его и затем строю.

3
Какой тест я могу использовать для сравнения уклонов двух или более регрессионных моделей?
Я хотел бы проверить разницу в ответе двух переменных на один предиктор. Вот минимальный воспроизводимый пример. library(nlme) ## gls is used in the application; lm would suffice for this example m.set <- gls(Sepal.Length ~ Petal.Width, data = iris, subset = Species == "setosa") m.vir <- gls(Sepal.Length ~ Petal.Width, data = …

1
Вычисление повторяемости эффектов по модели Лмера
Я только что наткнулся на эту статью , в которой описывается, как вычислить повторяемость (или надежность, или внутриклассовую корреляцию) измерения с помощью моделирования смешанных эффектов. Код R будет: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

6
Проблемы с круговыми диаграммами
Похоже, что все чаще обсуждают круговые диаграммы. Основными аргументами против этого являются: Площадь воспринимается с меньшей силой, чем длина. Круговые диаграммы имеют очень низкое отношение данных к пикселям Тем не менее, я думаю, что они могут быть как-то полезны при изображении пропорций. Я согласен использовать таблицу в большинстве случаев, но …

6
Какие есть альтернативы сломанным топорам?
Пользователи часто испытывают желание разбить значения осей, чтобы представить данные разных порядков величины на одном графике (см. Здесь ). Хотя это может быть удобно, это не всегда предпочтительный способ отображения данных (в лучшем случае может вводить в заблуждение). Каковы альтернативные способы отображения данных, которые различаются на несколько порядков? Я могу …

4
Зачем использовать цветовую карту Viridis над струей?
Как было объявлено в https://www.youtube.com/watch?v=xAoljeRJ3lU , Matplotlib меняет цветовую карту по умолчанию с jet на viridis. Однако я не очень хорошо понимаю это. Может потому что я дальтоник? Оригинальная струя цветовой карты выглядит очень сильной, я чувствую контраст: Хотя новой цветовой карте viridis не хватает этого контраста: Может кто-нибудь объяснить, …

4
Создание визуально привлекательных карт плотности плотности в R
Хотя я знаю, что существует ряд функций для генерации тепловых карт в R, проблема в том, что я не могу создавать визуально привлекательные карты. Например, изображения ниже являются хорошими примерами тепловых карт, которых я хочу избежать. В первом явно не хватает деталей, а в другом (основанном на тех же пунктах) …

5
Как добавить нелинейную линию тренда на график рассеяния в R? [закрыто]
Закрыто. Этот вопрос не по теме . В настоящее время не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто в прошлом году . У меня есть точечный график. Как я могу добавить нелинейную линию тренда?

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.