Вопросы с тегом «stata»

Статистический программный пакет. Используйте этот тег для любого тематического вопроса, который (а) включает в себя Stata либо в качестве критической части вопроса, либо ожидаемого ответа, а & (b) касается не только использования Stata.

4
R / Stata пакет для отрицательно усеченного отрицательного бинома GEE?
Это мой первый пост. Я действительно благодарен за это сообщество. Я пытаюсь проанализировать данные продольного счета, которые укорочены до нуля (вероятность того, что переменная отклика = 0 равна 0), а среднее значение! = Дисперсия, поэтому для пуассона было выбрано отрицательное биномиальное распределение. Функции / команды, которые я исключил: р Функция …

3
Применяется ли процедура фиксированных эффектов Мундлака для логистической регрессии с использованием макетов?
У меня есть набор данных с 8000 кластеров и 4 миллиона наблюдений. К сожалению, мое статистическое программное обеспечение, Stata, работает довольно медленно при использовании функции панельных данных для логистической регрессии: xtlogitдаже с 10% -ной выборкой. Однако при использовании непанельной logitфункции результаты появляются гораздо раньше. Поэтому я могу извлечь выгоду из …

1
Как сделать регрессию инструментальных переменных с помощью инструментального термина взаимодействия в Stata?
У меня есть небольшая проблема с синтаксисом Stata. Мне нужно сделать следующую регрессию: y=ax+bz+c(xz)+ey=ax+bz+c(xz)+ey = ax + bz + c(xz) + e где и и инструментированы, а также член взаимодействия использует инструментальные значения и .xxxzzzxzxzxzxxxzzz Просто генерирование предсказанных значений для и и использование их в качестве регрессоров приводит к неправильным …

3
Иллюстративные наборы данных и анализ для многоуровневого моделирования
Недавно я прошла вводный курс по многоуровневому моделированию. Большинство наборов данных и примеров, которые мы использовали, были из социальных наук. Я только что получил 2-х недельную стажировку в отделе биостатистики, где они хотят, чтобы я начал проект, касающийся различий на уровне больниц в исходах для неотложных состояний с высоким уровнем …

1
Какой метод мета-анализа сети является лучшим?
В настоящее время существует несколько различных подходов для выполнения сетевого мета-анализа или сравнения смешанного лечения. Наиболее часто используемые и доступные из них, вероятно, следующие: в байесовских рамках : подход взаимодействия дизайн-за-лечением в WinBUGS (например, Jackson et al ); иерархическое байесовское моделирование в WinBUGS (например, Zhao et al ); иерархическое байесовское …

3
Зачем использовать DV с задержкой в ​​качестве инструментальной переменной?
Я унаследовал некоторый код анализа данных, который, не будучи эконометриком, я изо всех сил пытаюсь понять. Одна модель запускает регрессию инструментальных переменных с помощью следующей команды Stata ivreg my_dv var1 var2 var3 (L.my_dv = D2.my_dv D3.my_dv D4.my_dv) Этот набор данных представляет собой панель с несколькими последовательными наблюдениями для этого набора …

1
Присвоить веса переменным в кластерном анализе
Я хочу назначить разные веса переменным в моем кластерном анализе, но моя программа (Stata), похоже, не имеет возможности для этого, поэтому мне нужно сделать это вручную. Представьте себе 4 переменные A, B, C, D. Веса для этих переменных должны быть w(A)=50% w(B)=25% w(C)=10% w(D)=15% Мне интересно, действительно ли один из …
12 clustering  stata 

1
Метрика оценки прогноза для панельных / продольных данных
Я хотел бы оценить несколько различных моделей, которые обеспечивают предсказания поведения на ежемесячном уровне. Данные сбалансированы, и 100 000 и T = 12. В результате посещение концерта происходит в определенном месяце, поэтому оно равно нулю для ~ 80% людей в любом месяце, но есть длинный правый хвост для активных пользователей. …

2
Должен ли я проводить отдельные регрессии для каждого сообщества или сообщество может быть просто управляющей переменной в агрегированной модели?
Я использую модель OLS с непрерывной переменной индекса ресурса в качестве DV. Мои данные собраны из трех аналогичных сообществ в географической близости друг к другу. Несмотря на это, я подумал, что важно использовать сообщество в качестве управляющей переменной. Как оказалось, сообщество значимо на уровне 1% (t-оценка -4,52). Сообщество - это …

5
Как сравнить 2 нестационарных временных ряда, чтобы определить корреляцию?
У меня есть два ряда данных, которые показывают средний возраст смерти с течением времени. Обе серии демонстрируют повышенный возраст на момент смерти, но один значительно ниже другого. Я хочу определить, значительно ли увеличение возраста на момент смерти у нижней выборки, чем у верхней выборки. Вот данные , упорядоченные по годам …

2
Должен ли я загружаться на уровне кластера или на индивидуальном уровне?
У меня есть модель выживания с пациентами, размещенными в больницах, которая включает случайный эффект для больниц. Случайный эффект имеет гамма-распределение, и я пытаюсь сообщить о «значимости» этого термина в легко понятной шкале. Я нашел следующие ссылки, в которых используется Медианное соотношение рисков (немного похожее на Медианный коэффициент вероятности), и рассчитал …

1
Как мне включить инновационный выброс при наблюдении 48 в мою модель ARIMA?
Я работаю над набором данных. После использования некоторых методов идентификации моделей я разработал модель ARIMA (0,2,1). Я использовал detectIOфункцию в пакете TSAв R, чтобы обнаружить инновационный выброс (IO) на 48-м наблюдении за моим исходным набором данных. Как включить этот выброс в мою модель, чтобы я мог использовать его для целей …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

2
Различия в определении куртоза и их интерпретация
Недавно я понял, что существуют различия в значениях эксцесса, предоставляемых SPSS и Stata. См. Http://www.ats.ucla.edu/stat/mult_pkg/faq/general/kurtosis.htm. Насколько я понимаю, интерпретация одного и того же будет другой. Любой совет, как с этим бороться?

2
Графики в регрессионном разрыве дизайна в «Stata» или «R»
Lee и Lemieux (стр. 31, 2009) предлагают исследователю представить графики при выполнении анализа разрыва непрерывности регрессии (RDD). Они предлагают следующую процедуру: «... для некоторой полосы пропускания и для некоторого числа бинов и слева и справа от значения отсечки, соответственно, идея состоит в том, чтобы построить бины ( , ], для …

1
Почему Anova () и drop1 () предоставили разные ответы для GLMM?
У меня есть GLMM формы: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Когда я использую drop1(model, test="Chi"), я получаю другие результаты, чем если бы я использовал Anova(model, type="III")из пакета автомобиля или summary(model). Последние два дают одинаковые ответы. Используя кучу сфабрикованных данных, я обнаружил, …
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.