Вопросы с тегом «non-independent»

Данные, события, процессы и т. Д. Не являются независимыми, если знание одного предоставляет некоторую информацию о состоянии или значении другого.

5
О важности предположения IID в статистическом обучении
В статистическом обучении, неявно или явно, всегда предполагается, что обучающий набор состоит из наборов ввода / ответа , которые независимо взяты из одного и того же совместного распределения сD ={ X , y }D={X,y}\mathcal{D} = \{ \bf {X}, \bf{y} \}NNNP ( X , y )( Xя, уя)(Xi,yi)({\bf{X}}_i,y_i) P(X,y)P(X,y)\mathbb{P}({\bf{X}},y) p(X,y)=p(y|X)p(X)p(X,y)=p(y|X)p(X) p({\bf{X}},y) …

5
Как мне проверить нелинейную связь?
Для графика 1 я могу проверить связь между x и y, выполнив простую корреляцию. Для графика 2, где взаимосвязь нелинейная, но существует четкая связь между x и y, как я могу проверить связь и обозначить ее природу?

5
Значение «положительной зависимости» как условия использования обычного метода контроля FDR
Бенджамини и Хохберг разработали первый (и, я думаю, до сих пор наиболее широко используемый) метод контроля частоты ложных обнаружений (FDR). Я хочу начать с набора значений P, каждое для отдельного сравнения, и решить, какие из них являются достаточно низкими, чтобы их можно было назвать «открытием», контролируя FDR до указанного значения …

7
Корреляция эквивалентна ассоциации?
Мой профессор статистики утверждает, что слово «корреляция» применяется строго к линейным отношениям между переменными, тогда как слово «ассоциация» широко применяется к любому типу отношений. Другими словами, он утверждает, что термин «нелинейная корреляция» является оксюмороном. Из того, что я могу сделать из этого раздела в статье в Википедии « Корреляция и …

1
Свойства PCA для зависимых наблюдений
Обычно мы используем PCA как метод уменьшения размерности для данных, где предполагается, что случаи Вопрос: Каковы типичные нюансы в применении PCA для зависимых, неидеальных данных? Какие полезные / полезные свойства PCA для данных iid скомпрометированы (или полностью потеряны)? Например, данные могут быть многомерным временным рядом, и в этом случае можно …

1
Что означает «зависимый» и «независимый» тесты в литературе по множественным сравнениям?
В литературе как по частоте появления ошибок (FWER), так и по частоте ложных обнаружений (FDR) конкретные методы контроля FWER или FDR считаются подходящими для зависимых или независимых тестов. Например, в статье 1979 года «Простая последовательная объективная процедура множественных испытаний» Холм писал, чтобы противопоставить свой метод повышения Шидака и метод контроля …

3
Для интуиции, каковы некоторые реальные примеры некоррелированных, но зависимых случайных величин?
Объясняя, почему некоррелированные не подразумевают независимость, есть несколько примеров, которые включают в себя группу случайных величин, но все они кажутся такими абстрактными: 1 2 3 4 . Этот ответ, кажется, имеет смысл. Моя интерпретация: случайная величина и ее квадрат могут быть некоррелированными (поскольку, очевидно, отсутствие корреляции является чем-то вроде линейной …

1
Почему модели со смешанными эффектами разрешают зависимость?
Скажем, нас интересует, как на экзаменационные оценки учеников влияет количество часов, которые они изучают. Чтобы исследовать это соотношение, мы могли бы запустить следующую линейную регрессию: exam.gradesi=a+β1×hours.studiedi+eiexam.gradesi=a+β1×hours.studiedi+ei \text{exam.grades}_i = a + \beta_1 \times \text{hours.studied}_i + e_i Но если мы выбираем учеников из нескольких разных школ, мы можем ожидать, что ученики в …

1
Линейное моделирование смешанных эффектов с данными двойниковых исследований
Предположим, у меня есть некоторая переменная ответа которая была измерена от го брата в м семействе. Кроме того, некоторые поведенческие данные были собраны в то же время от каждого субъекта. Я пытаюсь проанализировать ситуацию с помощью следующей линейной модели смешанных эффектов: j i x i jyijyijy_{ij}jjjiiixijxijx_{ij} yij=α0+α1xij+δ1ixij+εijyij=α0+α1xij+δ1ixij+εijy_{ij} = \alpha_0 + …

1
Что такое долгосрочная дисперсия?
Как определяется долгосрочная дисперсия в области анализа временных рядов? Я понимаю, что это используется в том случае, если в данных есть корреляционная структура. Таким образом, наш стохастический процесс не будет семейством случайными переменными, а будет только идентично распределенным?X1,X2…X1,X2…X_1, X_2 \dots Могу ли я иметь стандартную ссылку в качестве введения в …



5
Как выполнить вменение значений в очень большом количестве точек данных?
У меня очень большой набор данных и около 5% случайных значений отсутствуют. Эти переменные связаны друг с другом. В следующем примере набор данных R - просто игрушечный пример с фиктивными коррелированными данными. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

3
В чем разница между линейно зависимой и линейно коррелированной?
Пожалуйста, объясните, в чем разница, если две переменные линейно зависимы или линейно коррелированы . Я посмотрел статью в Википедии, но не нашел подходящего примера. Пожалуйста, объясните это на примере.

6
Насколько проблематично контролировать несуществующие ковариаты в наблюдательном (т.е. нерандомизированном) исследовании?
Миллер и Чепмен (2001) утверждают, что абсолютно неуместно контролировать несуществующие ковариаты, которые связаны как с независимыми, так и с зависимыми переменными в наблюдательном (нерандомизированном) исследовании, хотя это обычно делается в социальных науках. Насколько проблематично это сделать? Как лучше всего справиться с этой проблемой? Если вы регулярно контролируете несуществующие ковариаты в …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.