Статистика и большие данные stata

4

R / Stata пакет для отрицательно усеченного отрицательного бинома GEE?

Это мой первый пост. Я действительно благодарен за это сообщество. Я пытаюсь проанализировать данные продольного счета, которые укорочены до нуля (вероятность того, что переменная отклика = 0 равна 0), а среднее значение! = Дисперсия, поэтому для пуассона было выбрано отрицательное биномиальное распределение. Функции / команды, которые я исключил: р Функция …

13 r stata count-data panel-data truncation

3

Применяется ли процедура фиксированных эффектов Мундлака для логистической регрессии с использованием макетов?

У меня есть набор данных с 8000 кластеров и 4 миллиона наблюдений. К сожалению, мое статистическое программное обеспечение, Stata, работает довольно медленно при использовании функции панельных данных для логистической регрессии: xtlogitдаже с 10% -ной выборкой. Однако при использовании непанельной logitфункции результаты появляются гораздо раньше. Поэтому я могу извлечь выгоду из …

12 logistic categorical-data stata fixed-effects-model

1

Как сделать регрессию инструментальных переменных с помощью инструментального термина взаимодействия в Stata?

У меня есть небольшая проблема с синтаксисом Stata. Мне нужно сделать следующую регрессию: y=ax+bz+c(xz)+ey=ax+bz+c(xz)+ey = ax + bz + c(xz) + e где и и инструментированы, а также член взаимодействия использует инструментальные значения и .xxxzzzxzxzxzxxxzzz Просто генерирование предсказанных значений для и и использование их в качестве регрессоров приводит к неправильным …

12 stata interaction instrumental-variables

3

Иллюстративные наборы данных и анализ для многоуровневого моделирования

Недавно я прошла вводный курс по многоуровневому моделированию. Большинство наборов данных и примеров, которые мы использовали, были из социальных наук. Я только что получил 2-х недельную стажировку в отделе биостатистики, где они хотят, чтобы я начал проект, касающийся различий на уровне больниц в исходах для неотложных состояний с высоким уровнем …

12 r stata multilevel-analysis epidemiology

1

Какой метод мета-анализа сети является лучшим?

В настоящее время существует несколько различных подходов для выполнения сетевого мета-анализа или сравнения смешанного лечения. Наиболее часто используемые и доступные из них, вероятно, следующие: в байесовских рамках : подход взаимодействия дизайн-за-лечением в WinBUGS (например, Jackson et al ); иерархическое байесовское моделирование в WinBUGS (например, Zhao et al ); иерархическое байесовское …

12 r stata sas winbugs network-meta-analysis

3

Зачем использовать DV с задержкой в качестве инструментальной переменной?

Я унаследовал некоторый код анализа данных, который, не будучи эконометриком, я изо всех сил пытаюсь понять. Одна модель запускает регрессию инструментальных переменных с помощью следующей команды Stata ivreg my_dv var1 var2 var3 (L.my_dv = D2.my_dv D3.my_dv D4.my_dv) Этот набор данных представляет собой панель с несколькими последовательными наблюдениями для этого набора …

12 regression stata instrumental-variables

1

Присвоить веса переменным в кластерном анализе

Я хочу назначить разные веса переменным в моем кластерном анализе, но моя программа (Stata), похоже, не имеет возможности для этого, поэтому мне нужно сделать это вручную. Представьте себе 4 переменные A, B, C, D. Веса для этих переменных должны быть w(A)=50% w(B)=25% w(C)=10% w(D)=15% Мне интересно, действительно ли один из …

12 clustering stata

1

Метрика оценки прогноза для панельных / продольных данных

Я хотел бы оценить несколько различных моделей, которые обеспечивают предсказания поведения на ежемесячном уровне. Данные сбалансированы, и 100 000 и T = 12. В результате посещение концерта происходит в определенном месяце, поэтому оно равно нулю для ~ 80% людей в любом месяце, но есть длинный правый хвост для активных пользователей. …

11 repeated-measures predictive-models stata panel-data validation

2

Должен ли я проводить отдельные регрессии для каждого сообщества или сообщество может быть просто управляющей переменной в агрегированной модели?

Я использую модель OLS с непрерывной переменной индекса ресурса в качестве DV. Мои данные собраны из трех аналогичных сообществ в географической близости друг к другу. Несмотря на это, я подумал, что важно использовать сообщество в качестве управляющей переменной. Как оказалось, сообщество значимо на уровне 1% (t-оценка -4,52). Сообщество - это …

11 regression categorical-data stata multiple-regression aggregation

5

Как сравнить 2 нестационарных временных ряда, чтобы определить корреляцию?

У меня есть два ряда данных, которые показывают средний возраст смерти с течением времени. Обе серии демонстрируют повышенный возраст на момент смерти, но один значительно ниже другого. Я хочу определить, значительно ли увеличение возраста на момент смерти у нижней выборки, чем у верхней выборки. Вот данные , упорядоченные по годам …

11 time-series correlation stata

2

Должен ли я загружаться на уровне кластера или на индивидуальном уровне?

У меня есть модель выживания с пациентами, размещенными в больницах, которая включает случайный эффект для больниц. Случайный эффект имеет гамма-распределение, и я пытаюсь сообщить о «значимости» этого термина в легко понятной шкале. Я нашел следующие ссылки, в которых используется Медианное соотношение рисков (немного похожее на Медианный коэффициент вероятности), и рассчитал …

10 stata bootstrap multilevel-analysis resampling frailty

1

Как мне включить инновационный выброс при наблюдении 48 в мою модель ARIMA?

Я работаю над набором данных. После использования некоторых методов идентификации моделей я разработал модель ARIMA (0,2,1). Я использовал detectIOфункцию в пакете TSAв R, чтобы обнаружить инновационный выброс (IO) на 48-м наблюдении за моим исходным набором данных. Как включить этот выброс в мою модель, чтобы я мог использовать его для целей …

10 r time-series arima outliers hypergeometric fishers-exact r time-series intraclass-correlation r logistic glmm clogit mixed-model spss repeated-measures ancova machine-learning python scikit-learn distributions data-transformation stochastic-processes web standard-deviation r machine-learning spatial similarities spatio-temporal binomial sparse poisson-process r regression nonparametric r regression logistic simulation power-analysis r svm random-forest anova repeated-measures manova regression statistical-significance cross-validation group-differences model-comparison r spatial model-evaluation parallel-computing generalized-least-squares r stata fitting mixture hypothesis-testing categorical-data hypothesis-testing anova statistical-significance repeated-measures likert wilcoxon-mann-whitney boxplot statistical-significance confidence-interval forecasting prediction-interval regression categorical-data stata least-squares experiment-design skewness reliability cronbachs-alpha r regression splines maximum-likelihood modeling likelihood-ratio profile-likelihood nested-models

2

Различия в определении куртоза и их интерпретация

Недавно я понял, что существуют различия в значениях эксцесса, предоставляемых SPSS и Stata. См. Http://www.ats.ucla.edu/stat/mult_pkg/faq/general/kurtosis.htm. Насколько я понимаю, интерпретация одного и того же будет другой. Любой совет, как с этим бороться?

10 spss stata interpretation kurtosis

2

Графики в регрессионном разрыве дизайна в «Stata» или «R»

Lee и Lemieux (стр. 31, 2009) предлагают исследователю представить графики при выполнении анализа разрыва непрерывности регрессии (RDD). Они предлагают следующую процедуру: «... для некоторой полосы пропускания и для некоторого числа бинов и слева и справа от значения отсечки, соответственно, идея состоит в том, чтобы построить бины ( , ], для …

10 r regression data-visualization stata regression-discontinuity

1

Почему Anova () и drop1 () предоставили разные ответы для GLMM?

У меня есть GLMM формы: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Когда я использую drop1(model, test="Chi"), я получаю другие результаты, чем если бы я использовал Anova(model, type="III")из пакета автомобиля или summary(model). Последние два дают одинаковые ответы. Используя кучу сфабрикованных данных, я обнаружил, …

10 r anova glmm r mixed-model bootstrap sample-size cross-validation roc auc sampling stratification random-allocation logistic stata interpretation proportion r regression multiple-regression linear-model lm r cross-validation cart rpart logistic generalized-linear-model econometrics experiment-design causality instrumental-variables random-allocation predictive-models data-mining estimation contingency-tables epidemiology standard-deviation mean ancova psychology statistical-significance cross-validation synthetic-data poisson-distribution negative-binomial bioinformatics sequence-analysis distributions binomial classification k-means distance unsupervised-learning euclidean correlation chi-squared spearman-rho forecasting excel exponential-smoothing binomial sample-size r change-point wilcoxon-signed-rank ranks clustering matlab covariance covariance-matrix normal-distribution simulation random-generation bivariate standardization confounding z-statistic forecasting arima minitab poisson-distribution negative-binomial poisson-regression overdispersion probability self-study markov-process estimation maximum-likelihood classification pca group-differences chi-squared survival missing-data contingency-tables anova proportion

Вопросы с тегом «stata»