Вопросы с тегом «continuous-data»

Случайная переменная называется непрерывной, если ее набор возможных значений неисчислим, а вероятность того, что она примет какое-либо конкретное значение, равна нулю ( для каждого действительного числа ). Случайная переменная является непрерывной тогда и только тогда, когда ее совокупная функция распределения вероятностей является непрерывной функцией. XP(X=x)=0x

3
Вычислительно эффективная оценка многомерного режима
Короткая версия: Какой наиболее эффективный в вычислительном отношении метод оценки режима многомерного набора данных, взятого из непрерывного распределения? Длинная версия: у меня есть набор данных, который мне нужен для оценки режима. Режим не совпадает со средним или медианой. Пример показан ниже, это 2D-пример, но решение ND было бы лучше: В …

3
когда непрерывная переменная
Я знаю, что для непрерывной переменной .P[X=x]=0P[X=x]=0P[X=x]=0 Но я не могу представить, что если , существует бесконечное количество возможных . А также почему их вероятности становятся бесконечно малыми?xP[X=x]=0P[X=x]=0P[X=x]=0xxx

3
Условная вероятность непрерывной переменной
Предположим, что случайная величина следует непрерывному равномерному распределению с параметрами 0 и 10 (т. Е. )U ∼ U ( 0 , 10 )UUUU∼ U ( 0 , 10 )U∼U(0,10)U \sim \rm{U}(0,10) Теперь давайте обозначим A событие, когда = 5, а B событие, когда равно или 6. Согласно моему пониманию, оба …

5
Как выполнить вменение значений в очень большом количестве точек данных?
У меня очень большой набор данных и около 5% случайных значений отсутствуют. Эти переменные связаны друг с другом. В следующем примере набор данных R - просто игрушечный пример с фиктивными коррелированными данными. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

3
Могу ли я использовать множественную регрессию, когда у меня смешаны категориальные и непрерывные предикторы?
Похоже, вы можете использовать кодирование для одной категориальной переменной, но у меня есть две категориальные и одна непрерывная переменная предиктора. Могу ли я использовать множественную регрессию для этого в SPSS и если да, то как? Благодарность!

2
Коэффициент корреляции для недихотомической номинальной переменной и порядковой или числовой переменной
Я уже прочитал все страницы на этом сайте, пытаясь найти ответ на мою проблему, но, похоже, никто не подходит мне ... Сначала я объясню вам, с какими данными я работаю ... Допустим, у меня есть вектор-массив с несколькими названиями городов, по одному для каждого из 300 пользователей. У меня также …

5
Вероятность того, что непрерывная случайная величина принимает фиксированную точку
Я нахожусь во вводном классе статистики, в котором функция плотности вероятности для непрерывных случайных величин была определена как . Я понимаю, что интеграл от но я не могу исправить это своей интуицией непрерывной случайной величины. Скажем, X является случайной величиной, равной количеству минут от времени t, когда поезд прибывает. Как …

1
Определение оптимальной дискретизации данных из непрерывного распределения
Предположим, у вас есть набор данных из непрерывного распределения с плотностью поддерживаемой на которая неизвестна, но довольно велико, поэтому плотность ядра (например) оценка, , довольно точна. Для конкретного приложения мне нужно преобразовать наблюдаемые данные в конечное число категорий, чтобы получить новый набор данных с подразумеваемой функцией массы .Y1,...,YnY1,...,YnY_{1}, ..., Y_{n}p(y)p(y)p(y)[0,1][0,1][0,1]nnnp^(y)p^(y)\hat{p}(y)Z1,...,ZnZ1,...,ZnZ_{1}, …

2
Использование пуассоновской регрессии для непрерывных данных?
Можно ли использовать распределение Пуассона для анализа как непрерывных, так и дискретных данных? У меня есть несколько наборов данных, в которых переменные ответа являются непрерывными, но напоминают распределение Пуассона, а не нормальное распределение. Однако распределение Пуассона является дискретным распределением и обычно связано с числами или счетами.

1
Как проверить, являются ли мои данные дискретными или непрерывными?
Мне кажется, что для выбора правильных статистических инструментов я должен сначала определить, является ли мой набор данных дискретным или непрерывным. Не могли бы вы научить меня, как я могу проверить, являются ли данные дискретными или непрерывными с помощью R?

5
Почему следует избегать биннинга любой ценой?
Итак, я прочитал несколько постов о том, почему всегда следует избегать биннинга. Популярной ссылкой для этого утверждения является эта ссылка . Основным препятствием является то, что точки биннинга (или точки отсечения) являются довольно произвольными, а также в результате потери информации, и что сплайны должны быть предпочтительными. Тем не менее, в …

1
Является ли когда-нибудь хорошей идеей дать «частичный кредит» (непрерывный результат) в обучении логистической регрессии?
Я тренирую логистическую регрессию, чтобы предсказать, какие бегуны, скорее всего, закончат изнурительную гонку на выносливость. Очень немногие бегуны заканчивают эту гонку, поэтому у меня серьезный дисбаланс классов и небольшой пример успеха (возможно, несколько десятков). Я чувствую, что могу получить хороший «сигнал» от десятков бегунов, которые почти сделали это. (Мои тренировочные …

3
Как интерпретировать отношение рисков по непрерывной переменной - единице разницы?
Я читаю статью, в которой показаны коэффициенты опасности для непрерывных переменных, но я не уверен, как интерпретировать данные значения. Мое текущее понимание коэффициентов опасности состоит в том, что число представляет относительную вероятность [события] при определенном условии. Например: если отношение риска смерти от рака легких при курении (бинарное событие) равно 2, …

2
Корреляция между дихотомической и непрерывной переменной
Я пытаюсь найти корреляцию между дихотомической и непрерывной переменной. Исходя из моей основной работы по этому вопросу, я обнаружил, что должен использовать независимый t-критерий, и предварительным условием для этого является то, что распределение переменной должно быть нормальным. Я выполнил тест Колмогорова-Смирнова для проверки нормальности и обнаружил, что непрерывная переменная является …

2
Как вы строите взаимодействие между фактором и непрерывным ковариатом?
Я хотел бы нарисовать на том же графике взаимодействие между моим постоянным предиктором и моим категорическим модератором. Я знаю, как это сделать, когда оба категориальны ( взаимодействие факторов ), но на самом деле не знаю, как это сделать, когда один непрерывен, а другой категоричен.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.