Статистика и большие данные data-visualization

3

Скажем, у меня есть следующие четырехмерные данные, где первые три можно рассматривать как координаты, а последние можно рассматривать как значения. c1, c2, c3, value 1, 2, 6, 0.456 34, 34, 12 0.27 12, 1, 66 0.95 Как лучше визуализировать влияние первых трех координат на последнее значение? Я знаю о трех …

12 r data-visualization

3

Как я могу интерпретировать график процента усечения относительно среднего значения?

Для части домашнего задания меня попросили вычислить усеченное среднее для набора данных, удалив самое маленькое и самое большое наблюдение, и интерпретировать результат. Среднее значение было ниже, чем среднее значение. Моя интерпретация заключалась в том, что это произошло потому, что базовое распределение было положительно искажено, поэтому левый хвост был более плотным, …

12 data-visualization interpretation mean trimmed-mean

2

Неправильно ли использовать линейные графики для дискретных данных?

Я часто видел дискретные наборы данных, построенные в виде линейных графиков, но мне приходит в голову, что линия выводит значение в точке между интервалами измерения, что не имеет смысла для дискретных наборов данных. Таким образом, неверно ли использование линейных графиков для дискретных данных? В качестве примера возьмем два набора данных …

12 data-visualization

2

График QQ не соответствует гистограмме

У меня есть гистограмма, плотность ядра и соответствующее нормальное распределение финансовых отчетов, которые превращаются в убытки (знаки меняются), и обычный график QQ этих данных: График QQ ясно показывает, что хвосты установлены неправильно. Но если я взгляну на гистограмму и установленное нормальное распределение (синее), даже значения около 0,0 не будут корректно …

12 data-visualization normality-assumption histogram qq-plot

1

Как рассчитать «Пути к Белому дому», используя R?

Я только что наткнулся на этот замечательный анализ, который одновременно интересен и красив: http://www.nytimes.com/interactive/2012/11/02/us/politics/paths-to-the-white-house.html Мне интересно, как такое «дерево путей» может быть построено с использованием R. Какие данные и алгоритм нужны для построения такого дерева путей? Благодарю.

12 r data-visualization politics

1

Построение кривой вероятности для логит-модели с несколькими предикторами

У меня есть следующая функция вероятности: Prob=11+e−zProb=11+e−z\text{Prob} = \frac{1}{1 + e^{-z}} где z=B0+B1X1+⋯+BnXn.z=B0+B1X1+⋯+BnXn.z = B_0 + B_1X_1 + \dots + B_nX_n. Моя модель выглядит Pr(Y=1)=11+exp(−[−3.92+0.014×(bid)])Pr(Y=1)=11+exp⁡(−[−3.92+0.014×(bid)])\Pr(Y=1) = \frac{1}{1 + \exp\left(-[-3.92 + 0.014\times(\text{bid})]\right)} Это визуализируется с помощью кривой вероятности, которая выглядит так, как показано ниже. Я рассматриваю возможность добавления пары переменных к …

12 r probability data-visualization logistic

1

Различия между PROC Mixed и lme / lmer в R - степени свободы

Примечание: этот вопрос является репостом, так как мой предыдущий вопрос пришлось удалить по юридическим причинам. Сравнивая PROC MIXED из SAS с функцией lmeиз nlmeпакета в R, я наткнулся на некоторые довольно запутанные различия. Более конкретно, степени свободы в разных тестах различаются между PROC MIXEDи lme, и я задавался вопросом, почему. …

12 r mixed-model sas degrees-of-freedom pdf unbiased-estimator distance-functions functional-data-analysis hellinger time-series outliers c++ relative-risk absolute-risk rare-events regression t-test multiple-regression survival teaching multiple-regression regression self-study t-distribution machine-learning recommender-system self-study binomial standard-deviation data-visualization r predictive-models pearson-r spearman-rho r regression modeling r categorical-data data-visualization ggplot2 many-categories machine-learning cross-validation weka microarray variance sampling monte-carlo regression cross-validation model-selection feature-selection elastic-net distance-functions information-theory r regression mixed-model random-effects-model fixed-effects-model dataset data-mining

1

Логистическая квантильная регрессия - как лучше всего передать результаты

В предыдущем посте я задавался вопросом, как справиться с оценками EQ-5D . Недавно я наткнулся на логистическую квантильную регрессию, предложенную Bottai и McKeown, которая представляет элегантный способ справиться с ограниченными результатами. Формула проста: л о гя т ( у) = Л о г( у- ум я нYм а х- у)logit(y)=log(y−yminymax−y)logit(y)=log(\frac{y-y_{min}}{y_{max}-y}) …

12 r logistic data-visualization logit quantile-regression

9

Как я могу создавать красивые графики автоматически?

Например. такие как те на этой странице http://store.steampowered.com/hwsurvey Есть ли готовое программное обеспечение, которое может сделать это? В качестве альтернативы, какие-либо рекомендации для другого программного обеспечения, которое делает что-то подобное? Я знаю, что это на самом деле не вопрос статистики, но я твердо убежден, что данные должны быть представлены аккуратно …

12 data-visualization interactive-visualization

2

Рисование нескольких графиков на графике в R [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто 4 года назад . Я хотел бы построить четыре барплота на одном графике в R. Я использовал следующий код. Здесь, как можно держать …

12 r data-visualization barplot

2

Как интерпретировать заговор Бланда-Альтмана?

В простом английском, как можно интерпретировать сюжет Бланда-Альтмана? Каковы преимущества использования графика Бланда-Альтмана перед другими методами сравнения двух разных методов измерения?

12 data-visualization bland-altman-plot

2

Можно ли строить линию регрессии для ранжированных данных (корреляция Спирмена)?

У меня есть данные, для которых я рассчитал корреляцию Спирмена и хочу визуализировать их для публикации. Зависимая переменная ранжируется, независимая переменная - нет. То, что я хочу визуализировать, является скорее общей тенденцией, чем фактическим наклоном, поэтому я оценил независимую и применил корреляцию / регрессию Спирмена. Но как только я подготовил …

12 regression data-visualization spearman-rho ordered-logit isotonic

5

Как сделать хорошую шкалу интенсивности цвета?

Я отнюдь не хорош в статистике, но думаю, что попал в нужное место. Мой вопрос прост: Моя проблема состоит в сравнении численности населения нескольких штатов в маленькой стране, но в некоторых штатах население составляет 3000 000 человек, а в некоторых - 2000 человек. Я рисую это на карте, и «интенсивность» …

12 data-visualization

1

Какая польза от t-SNE, кроме визуализации данных?

В каких ситуациях мы должны использовать t-SNE (кроме визуализации данных)? T-SNE используется для уменьшения размерности. Ответ на этот вопрос предполагает, что t-SNE следует использовать только для визуализации, и что мы не должны использовать его для кластеризации. Тогда какая польза от t-SNE?

12 data-visualization dimensionality-reduction tsne

1

Почему нам нужен график трассировки для результатов MCMC

Я читаю исследовательские работы с использованием методов MCMC, и я вижу, что большинство из них содержат графики. Зачем нам нужны трассировки участков в цепочке Монте-Карло Маркова? На что указывает трассировка параметров?

12 data-visualization mcmc

Вопросы с тегом «data-visualization»