Вопросы с тегом «modeling»

Этот тег описывает процесс создания статистической или машинной модели обучения. Всегда добавляйте более конкретный тег.

2
Каковы некоторые стандартные практики для создания синтетических наборов данных?
В качестве контекста: при работе с очень большим набором данных меня иногда спрашивают, можем ли мы создать синтетический набор данных, в котором мы «знаем» отношения между предикторами и переменной ответа или отношения между предикторами. На протяжении многих лет я, кажется, сталкивался либо с одноразовыми синтетическими наборами данных, которые выглядят так, …

5
Как линейная регрессия использует нормальное распределение?
При линейной регрессии предполагается, что каждое прогнозируемое значение было выбрано из нормального распределения возможных значений. Увидеть ниже. Но почему предполагается, что каждое прогнозируемое значение получено из нормального распределения? Как линейная регрессия использует это предположение? Что, если возможные значения обычно не распределяются?

2
Общая линейная модель против обобщенной линейной модели (с функцией тождественной связи?)
Это мой первый пост, поэтому, пожалуйста, будьте спокойны, если я не соблюдаю некоторые стандарты! Я искал свой вопрос, и ничего не пришло. Мой вопрос касается в основном практических различий между общим линейным моделированием (GLM) и обобщенным линейным моделированием (GZLM). В моем случае это будет несколько непрерывных переменных в качестве ковариат …

4
У вас есть глобальное видение тех методов анализа?
В настоящее время я работаю над проектом, в котором, как и всем нам, мне нужно понять, как выход связан с входом . Особенность в том, что данные выдаются мне по одному фрагменту за раз, поэтому я хочу обновлять свой анализ каждый раз, когда получаю новый . Я считаю, что это …

6
Введение в моделирование структурных уравнений
Коллеги просят меня помочь в этом вопросе, которого я действительно не знаю. Они выдвинули гипотезу о роли некоторых скрытых переменных в одном исследовании, и один из судей попросил их формализовать это в SEM. Поскольку то, что им нужно, не кажется слишком сложным, я думаю, что я попробую ... пока, я …

10
Есть ли у вас рекомендации для книг по самостоятельному обучению прикладной статистике на уровне выпускников?
В колледже я прошел несколько курсов по статистике, но обнаружил, что мое образование основано на теории. Мне было интересно, есть ли у кого-нибудь из вас текст в Прикладной статистике (на уровне выпускника), который вы рекомендуете, или у вас был хороший опыт.


4
Слабо информативные априорные распределения для параметров шкалы
Я использовал логарифмические нормальные распределения в качестве предыдущих распределений для параметров масштаба (для нормальных распределений, t-распределений и т. Д.), Когда у меня есть приблизительное представление о том, каким должен быть масштаб, но я хочу ошибиться, говоря, что я не знаю много об этом. Я использую это, потому что это использование …

4
Как спроецировать новый вектор на пространство PCA?
После выполнения анализа главных компонентов (PCA) я хочу спроецировать новый вектор на пространство PCA (т.е. найти его координаты в системе координат PCA). Я рассчитал PCA на языке R, используя prcomp. Теперь я должен быть в состоянии умножить свой вектор на матрицу вращения PCA. Должны ли главные компоненты в этой матрице …
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

3
Как объединить доверительные интервалы для дисперсионного компонента модели смешанных эффектов при использовании множественного вменения
Логика множественного вменения (МИ) состоит в том, чтобы вменять пропущенные значения не один раз, а несколько (обычно М = 5) раз, что приводит к М завершенным наборам данных. Затем M завершенных наборов данных анализируются с использованием методов полных данных, на которых M оценок и их стандартные ошибки объединяются с использованием …

2
Указание модели разницы в различиях с несколькими периодами времени
Когда я оцениваю модель разности различий с двумя периодами времени, эквивалентная модель регрессии а. Yist=α+γs∗Treatment+λdt+δ∗(Treatment∗dt)+ϵistYist=α+γs∗Treatment+λdt+δ∗(Treatment∗dt)+ϵistY_{ist} = \alpha +\gamma_s*Treatment + \lambda d_t + \delta*(Treatment*d_t)+ \epsilon_{ist} где TreatmentTreatmentTreatment - манекен, равный 1, если наблюдение относится к группе лечения и представляет собой манекен, который равен 1 в период времени после того, как лечение …

2
Методология прогнозирования VAR
Я строю модель VAR для прогнозирования цены актива и хотел бы знать, является ли мой метод статистически обоснованным, актуальны ли тесты, которые я включил, и нужно ли больше для обеспечения надежного прогноза на основе моих входных переменных. Ниже приведен мой текущий процесс проверки причинности Грейнджера и прогнозирования выбранной модели VAR. …
19 r  forecasting  modeling  var 

2
Как предсказать, когда произойдет следующее событие, основываясь на времени предыдущих событий?
Я учусь в старших классах и работаю над проектом по программированию, но у меня нет большого опыта в области статистики и моделирования данных, кроме курса по статистике в старших классах, поэтому я немного растерялся. По сути, у меня есть достаточно большой список (предположим, он достаточно большой, чтобы соответствовать предположениям для …

1
Каково мнение сообщества о Четвертом квадранте?
Нассим Талеб, известный (или позорный) Черный лебедь , развил концепцию и разработал то, что он называет «картой границ статистики» . Его основной аргумент заключается в том, что существует один вид решения проблемы, когда использование любой статистической модели вредно. Это могут быть любые проблемы с принятием решения, когда последствия принятия неправильного …

4
Могу ли я просто удалить одну из двух переменных-предикторов, которые имеют высокую линейную корреляцию?
Используя коэффициент корреляции Пирсона, у меня есть несколько переменных, которые сильно коррелированы ( и для 2 пар переменных, которые есть в моей модели).ρ = 0,978ρзнак равно0,978\rho = 0.978ρ = 0,989ρзнак равно0,989\rho = 0.989 Причина , некоторые из переменных имеют высокую корреляцию потому , что одна переменная используется в вычислении для …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.