Вопросы с тегом «categorical-data»

Категориальные (также называемые номинальными) данные могут принимать ограниченное количество возможных значений, называемых категориями. Категориальные значения «обозначают», они не «измеряют». Пожалуйста, используйте тег [ordinal-data] для дискретных, но упорядоченных типов данных.

1
Интерпретация коэффициентов взаимодействия между категориальной и непрерывной переменной
У меня вопрос по поводу интерпретации коэффициентов взаимодействия между непрерывной и категориальной переменными. вот моя модель: model_glm3=glm(cog~lg_hag+race+pdg+sex+as.factor(educa)+(lg_hag:as.factor(educa)), data=base_708) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 21.4836 2.0698 10.380 < 2e-16 *** lg_hag 8.5691 3.7688 2.274 0.02334 * raceblack -8.4715 1.7482 -4.846 1.61e-06 *** racemexican -3.0483 1.7073 -1.785 0.07469 . …

1
R линейная регрессия категориальной переменной «скрытое» значение
Это всего лишь пример, с которым я сталкивался несколько раз, поэтому у меня нет примеров данных. Запуск модели линейной регрессии в R: a.lm = lm(Y ~ x1 + x2) x1является непрерывной переменной x2является категориальным и имеет три значения, например, «Низкий», «Средний» и «Высокий». Однако вывод, заданный R, будет выглядеть примерно …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

3
Проблемы с фиктивными переменными
Я запускаю большую регрессию OLS, где все независимые переменные (около 400) являются фиктивными переменными. Если все они включены, то существует идеальная мультиколлинеарность (фиктивная переменная ловушка), поэтому я должен опустить одну из переменных перед запуском регрессии. Мой первый вопрос: какая переменная должна быть опущена? Я читал, что лучше опустить переменную, которая …

1
Почему столбец пересечения в model.matrix заменяет первый фактор?
Я пытаюсь преобразовать столбец фактора в фиктивные переменные: str(cards$pointsBin) # Factor w/ 5 levels ".lte100",".lte150",..: 3 2 3 1 4 4 2 2 4 4 ... labels <- model.matrix(~ pointsBin, data=cards) head(labels) # (Intercept) pointsBin.lte150 pointsBin.lte200 pointsBin.lte250 pointsBin.lte300 # 741 1 0 0 0 0 # 407 1 1 0 …

4
Разработать статистический тест для различения двух продуктов
У меня есть набор данных из опроса клиентов, я хочу развернуть статистический тест, чтобы увидеть, есть ли разница в значении между продуктом 1 и продуктом 2. Вот набор данных отзывов клиентов. Оценка от очень плохой, плохой, хорошо, хорошо, до очень хорошо. customer product1 product2 1 very good very bad 2 …

1
Метод опроса по личным вопросам
Мой друг-статистик рассказал мне об интересной методике, используемой для получения честных ответов на опросы, посвященные деликатным вопросам. Я вспоминаю общую суть метода, но мне интересно, знает ли кто-нибудь подробности и упоминается ли он где-нибудь. История состояла в том, что АМА во Флориде хотела оценить употребление наркотиков среди врачей. Они разослали …

2
Как вы строите взаимодействие между фактором и непрерывным ковариатом?
Я хотел бы нарисовать на том же графике взаимодействие между моим постоянным предиктором и моим категорическим модератором. Я знаю, как это сделать, когда оба категориальны ( взаимодействие факторов ), но на самом деле не знаю, как это сделать, когда один непрерывен, а другой категоричен.

2
Корреляция между категориями между категориальными номинальными переменными
У меня есть набор данных с двумя категориальными номинальными переменными (обе с 5 категориями). Я хотел бы знать, если (и как) я могу определить потенциальные корреляции между категориями из этих двух переменных. Другими словами, показывают ли, например, результаты категории в переменной 1 сильную корреляцию с определенной категорией j в переменной …

2
Параметрический, полупараметрический и непараметрический бутстрап для смешанных моделей
Следующие прививки взяты из этой статьи . Я новичок в начальной загрузке и пытаюсь реализовать параметрическую, полупараметрическую и непараметрическую загрузку начальной загрузки для линейной смешанной модели с R bootпакетом. Код R Вот мой Rкод: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 

1
Как измерить корреляцию между категориальной переменной? [Дубликат]
На этот вопрос уже есть ответ здесь : корреляция между категориальными переменными (1 ответ) Закрыто 6 месяцев назад . Я знаю, что мы можем использовать Спирмена для измерения корреляции между числовыми переменными. Но как измерить корреляцию между категориальными переменными?

1
Как вписать модель Брэдли – Терри – Люса в R без сложной формулы?
Модель Брэдли – Терри – Люса (BTL) утверждает, что , где - вероятность того, что объект j будет оценен как «лучший», тяжелее, и т. д., чем объект i , и \ delta_i , и \ delta_j являются параметрами.pji=logit−1(δj−δi)pji=logit−1(δj−δi)p_{ji} = logit^{-1}(\delta_j - \delta_i)pijpijp_{ij}jjjiiiδiδi\delta_iδjδj\delta_j Кажется, это кандидат на функцию glm с family …

4
Как реализовать фиктивную переменную, используя n-1 переменные?
Если у меня есть переменная с 4 уровнями, теоретически мне нужно использовать 3 фиктивные переменные. На практике, как это на самом деле осуществляется? Я использую 0-3, я использую 1-3 и оставляю 4 пустыми? Какие-либо предложения? ПРИМЕЧАНИЕ: я собираюсь работать в R. ОБНОВЛЕНИЕ: Что случилось бы, если бы я только использовал …

2
Лучшие практики при обработке данных о дальности как непрерывных
Я смотрю на то, связано ли изобилие с размером. Размер (конечно) непрерывен, однако, численность записывается в таком масштабе, что A = 0-10 B = 11-25 C = 26-50 D = 51-100 E = 101-250 F = 251-500 G = 501-1000 H = 1001-2500 I = 2501-5000 J = 5001-10,000 etc... …

3
Могут ли случайные эффекты применяться только к категориальным переменным?
Эти вопросы могут показаться глупыми, но ... верно ли, что случайные эффекты могут применяться только к категориальным переменным (таким как индивидуальный идентификатор, идентификатор популяции, ...), например, скажем, является категориальной переменной:xixix_i β x iyiyiy_i ~βxiβxi\beta_{x_i} N o r m ( μ , δ 2 )βxiβxi\beta_{x_i} ~Norm(μ,δ2)Norm(μ,δ2)Norm(\mu, \delta^2) но из принципа случайный …

2
Коррекция непрерывности Yates для 2 x 2 таблиц сопряженности
Я хотел бы собрать информацию от людей в этой области о корректировке непрерывности Йейтса для таблиц 2 x 2. В статье в Википедии упоминается, что она может слишком далеко отрегулироваться и поэтому используется только в ограниченном смысле. Родственный пост здесь не предлагает гораздо более глубокий. Итак, что вы думаете о …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.