Вопросы с тегом «data-visualization»

Построение значимых и полезных графических представлений данных. (Если ваш вопрос только о том, как заставить определенное программное обеспечение производить определенный эффект, то, скорее всего, это не по теме.)

3
Какие популярные варианты визуализации 4-мерных данных?
Скажем, у меня есть следующие четырехмерные данные, где первые три можно рассматривать как координаты, а последние можно рассматривать как значения. c1, c2, c3, value 1, 2, 6, 0.456 34, 34, 12 0.27 12, 1, 66 0.95 Как лучше визуализировать влияние первых трех координат на последнее значение? Я знаю о трех …

3
Как я могу интерпретировать график процента усечения относительно среднего значения?
Для части домашнего задания меня попросили вычислить усеченное среднее для набора данных, удалив самое маленькое и самое большое наблюдение, и интерпретировать результат. Среднее значение было ниже, чем среднее значение. Моя интерпретация заключалась в том, что это произошло потому, что базовое распределение было положительно искажено, поэтому левый хвост был более плотным, …

2
Неправильно ли использовать линейные графики для дискретных данных?
Я часто видел дискретные наборы данных, построенные в виде линейных графиков, но мне приходит в голову, что линия выводит значение в точке между интервалами измерения, что не имеет смысла для дискретных наборов данных. Таким образом, неверно ли использование линейных графиков для дискретных данных? В качестве примера возьмем два набора данных …

2
График QQ не соответствует гистограмме
У меня есть гистограмма, плотность ядра и соответствующее нормальное распределение финансовых отчетов, которые превращаются в убытки (знаки меняются), и обычный график QQ этих данных: График QQ ясно показывает, что хвосты установлены неправильно. Но если я взгляну на гистограмму и установленное нормальное распределение (синее), даже значения около 0,0 не будут корректно …

1
Как рассчитать «Пути к Белому дому», используя R?
Я только что наткнулся на этот замечательный анализ, который одновременно интересен и красив: http://www.nytimes.com/interactive/2012/11/02/us/politics/paths-to-the-white-house.html Мне интересно, как такое «дерево путей» может быть построено с использованием R. Какие данные и алгоритм нужны для построения такого дерева путей? Благодарю.

1
Построение кривой вероятности для логит-модели с несколькими предикторами
У меня есть следующая функция вероятности: Prob=11+e−zProb=11+e−z\text{Prob} = \frac{1}{1 + e^{-z}} где z=B0+B1X1+⋯+BnXn.z=B0+B1X1+⋯+BnXn.z = B_0 + B_1X_1 + \dots + B_nX_n. Моя модель выглядит Pr(Y=1)=11+exp(−[−3.92+0.014×(bid)])Pr(Y=1)=11+exp⁡(−[−3.92+0.014×(bid)])\Pr(Y=1) = \frac{1}{1 + \exp\left(-[-3.92 + 0.014\times(\text{bid})]\right)} Это визуализируется с помощью кривой вероятности, которая выглядит так, как показано ниже. Я рассматриваю возможность добавления пары переменных к …

1
Различия между PROC Mixed и lme / lmer в R - степени свободы
Примечание: этот вопрос является репостом, так как мой предыдущий вопрос пришлось удалить по юридическим причинам. Сравнивая PROC MIXED из SAS с функцией lmeиз nlmeпакета в R, я наткнулся на некоторые довольно запутанные различия. Более конкретно, степени свободы в разных тестах различаются между PROC MIXEDи lme, и я задавался вопросом, почему. …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

1
Логистическая квантильная регрессия - как лучше всего передать результаты
В предыдущем посте я задавался вопросом, как справиться с оценками EQ-5D . Недавно я наткнулся на логистическую квантильную регрессию, предложенную Bottai и McKeown, которая представляет элегантный способ справиться с ограниченными результатами. Формула проста: л о гя т ( у) = Л о г( у- ум я нYм а х- у)logit(y)=log(y−yminymax−y)logit(y)=log(\frac{y-y_{min}}{y_{max}-y}) …

9
Как я могу создавать красивые графики автоматически?
Например. такие как те на этой странице http://store.steampowered.com/hwsurvey Есть ли готовое программное обеспечение, которое может сделать это? В качестве альтернативы, какие-либо рекомендации для другого программного обеспечения, которое делает что-то подобное? Я знаю, что это на самом деле не вопрос статистики, но я твердо убежден, что данные должны быть представлены аккуратно …

2
Рисование нескольких графиков на графике в R [закрыто]
Закрыто. Этот вопрос не по теме . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто 4 года назад . Я хотел бы построить четыре барплота на одном графике в R. Я использовал следующий код. Здесь, как можно держать …


2
Можно ли строить линию регрессии для ранжированных данных (корреляция Спирмена)?
У меня есть данные, для которых я рассчитал корреляцию Спирмена и хочу визуализировать их для публикации. Зависимая переменная ранжируется, независимая переменная - нет. То, что я хочу визуализировать, является скорее общей тенденцией, чем фактическим наклоном, поэтому я оценил независимую и применил корреляцию / регрессию Спирмена. Но как только я подготовил …

5
Как сделать хорошую шкалу интенсивности цвета?
Я отнюдь не хорош в статистике, но думаю, что попал в нужное место. Мой вопрос прост: Моя проблема состоит в сравнении численности населения нескольких штатов в маленькой стране, но в некоторых штатах население составляет 3000 000 человек, а в некоторых - 2000 человек. Я рисую это на карте, и «интенсивность» …

1
Какая польза от t-SNE, кроме визуализации данных?
В каких ситуациях мы должны использовать t-SNE (кроме визуализации данных)? T-SNE используется для уменьшения размерности. Ответ на этот вопрос предполагает, что t-SNE следует использовать только для визуализации, и что мы не должны использовать его для кластеризации. Тогда какая польза от t-SNE?

1
Почему нам нужен график трассировки для результатов MCMC
Я читаю исследовательские работы с использованием методов MCMC, и я вижу, что большинство из них содержат графики. Зачем нам нужны трассировки участков в цепочке Монте-Карло Маркова? На что указывает трассировка параметров?

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.