Вопросы с тегом «continuous-data»

Случайная переменная называется непрерывной, если ее набор возможных значений неисчислим, а вероятность того, что она примет какое-либо конкретное значение, равна нулю ( для каждого действительного числа ). Случайная переменная является непрерывной тогда и только тогда, когда ее совокупная функция распределения вероятностей является непрерывной функцией. XP(X=x)=0x

6
Корреляции с неупорядоченными категориальными переменными
У меня есть датафрейм со многими наблюдениями и многими переменными. Некоторые из них являются категориальными (неупорядоченными), а другие числовыми. Я ищу ассоциации между этими переменными. Я был в состоянии вычислить корреляцию для числовых переменных (корреляция Спирмена), но: Я не знаю, как измерить корреляцию между неупорядоченными категориальными переменными. Я не знаю, …

3
Пример: регрессия LASSO с использованием glmnet для двоичного результата
Я начинаю баловаться с использованием glmnetс LASSO регрессией , где мой результат представляет интерес дихотомический. Я создал небольшой фрейм данных ниже: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, …
78 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

7
В чем выгода разделения непрерывной переменной-предиктора?
Мне интересно, каково значение брать непрерывную переменную предиктора и разбивать ее (например, на квинтили), прежде чем использовать ее в модели. Мне кажется, что при биннинге переменной мы теряем информацию. Это просто для того, чтобы мы могли моделировать нелинейные эффекты? Если бы мы сохраняли переменную непрерывной, и это не было действительно …

1
Корреляция между номинальной (IV) и непрерывной (DV) переменной
У меня есть номинальная переменная (разные темы разговора, закодированные как topic0 = 0 и т. Д.) И ряд масштабных переменных (DV), таких как продолжительность разговора. Как я могу получить корреляции между номинальными и масштабными переменными?


8
Имеет ли смысл когда-либо рассматривать категориальные данные как непрерывные?
Отвечая на этот вопрос о дискретных и непрерывных данных, я уверенно утверждал, что редко имеет смысл рассматривать категориальные данные как непрерывные. На первый взгляд это кажется само собой разумеющимся, но интуиция часто является плохим руководством для статистики, или, по крайней мере, моим. Так что теперь я задаюсь вопросом: это правда? …

5
Кластеризация набора данных с дискретными и непрерывными переменными
У меня есть набор данных X, который имеет 10 измерений, 4 из которых являются дискретными значениями. Фактически, эти 4 дискретные переменные являются порядковыми, то есть более высокое значение подразумевает более высокую / лучшую семантику. 2 из этих дискретных переменных являются категориальными в том смысле, что для каждой из этих переменных …

4
Прогнозирование с использованием как непрерывных, так и категориальных функций
Некоторые методы прогнозирующего моделирования больше предназначены для обработки непрерывных предикторов, а другие - для обработки категориальных или дискретных переменных. Конечно, существуют методы преобразования одного типа в другой (дискретизация, фиктивные переменные и т. Д.). Однако существуют ли какие-либо методы прогнозного моделирования, которые предназначены для одновременной обработки обоих типов ввода без простой …

2
Непрерывное обобщение отрицательного биномиального распределения
Отрицательное биномиальное (NB) распределение определяется на неотрицательных целых числах и имеет функцию вероятности массыИмеет ли смысл рассматривать непрерывное распределение на неотрицательных вещественных числах, определенных той же формулой (заменив k \ in \ mathbb N_0 на x \ in \ mathbb R _ {\ ge 0} )? Биномиальный коэффициент может быть …

2
Когда мы должны дискретизировать / bin непрерывные независимые переменные / функции, а когда нет?
Когда мы должны дискретизировать / bin независимые переменные / функции, а когда нет? Мои попытки ответить на вопрос: В общем, мы не должны bin, потому что binning потеряет информацию. Биннинг на самом деле увеличивает степень свободы модели, поэтому после биннинга возможна чрезмерная подгонка. Если у нас модель «высокого смещения», биннинг …

2
Равномерная случайная величина как сумма двух случайных величин
Взято из Гриммета и Штирзакера : Покажите, что это не может быть случай, когда где равномерно распределены по [0,1], а и независимы и одинаково распределены. Вы не должны считать , что X и Y являются непрерывными переменными.U = X + Y U=X+YU=X+YU UUX XXYYY Простое доказательство от противного достаточно для …

1
Как выбрать между ANOVA и ANCOVA в разработанном эксперименте?
Я провожу эксперимент, который имеет следующее: DV: потребление среза (непрерывное или может быть категоричным) IV: здоровое сообщение, нездоровое сообщение, отсутствие сообщения (контроль) (3 группы, в которых люди назначаются случайным образом - категорично) Это манипулируемое сообщение о здоровье среза. Следующие IV могут рассматриваться как отдельные переменные различия: Импульсивность (это может быть …


2
Всегда ли неправильно переходить от непрерывных данных к категориальным?
Когда я читал о том, как настроить ваши данные, я часто сталкивался с тем, что преобразование некоторых непрерывных данных в категориальные данные не является хорошей идеей, поскольку вы можете сделать неправильный вывод, если пороговые значения плохо определены. Тем не менее, в настоящее время у меня есть некоторые данные (значения PSA …

1
Как правильно оценить корреляцию между порядковым и непрерывным переменным?
Я хотел бы оценить соотношение между: Порядковая переменная: испытуемых просят оценить предпочтение 6 видов фруктов по шкале от 1 до 5 (от очень отвратительных до очень вкусных). В среднем предметы используют только 3 балла. Непрерывная переменная: одним и тем же субъектам предлагается быстро идентифицировать эти фрукты, что приводит к средней …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.