Вопросы с тегом «self-study»

Обычное упражнение из учебника, курса или теста, используемое для занятий или самостоятельных занятий. Политика этого сообщества состоит в том, чтобы «предоставлять полезные советы» для таких вопросов, а не полные ответы.

5
Как выполнить вменение значений в очень большом количестве точек данных?
У меня очень большой набор данных и около 5% случайных значений отсутствуют. Эти переменные связаны друг с другом. В следующем примере набор данных R - просто игрушечный пример с фиктивными коррелированными данными. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 


4
Ожидаемое число: я буду после розыгрыша карт, пока не получу туза, 2, 3 и т. Д.
У меня возникли проблемы с решением следующего. Вы берете карты из стандартной колоды из 52 карт без замены, пока не получите туза. Вы вытягиваете из того, что осталось, пока не получите 2. Вы продолжаете с 3. Какое ожидаемое число вы будете иметь после того, как закончится вся колода? Было естественно …

2
Что такое полная достаточная статистика?
У меня есть проблемы с пониманием полной достаточной статистики? Пусть - достаточная статистика.T= Σ xяTзнак равноΣИксяT=\Sigma x_i Если с вероятностью 1 для некоторой функции g , то это полная достаточная статистика.Е[ г( Т) ] = 0Е[грамм(T)]знак равно0E[g(T)]=0граммграммg Но что это значит? Я видел примеры униформы и Бернулли (страница 6 http://amath.colorado.edu/courses/4520/2011fall/HandOuts/umvue.pdf …

1
Различия между PROC Mixed и lme / lmer в R - степени свободы
Примечание: этот вопрос является репостом, так как мой предыдущий вопрос пришлось удалить по юридическим причинам. Сравнивая PROC MIXED из SAS с функцией lmeиз nlmeпакета в R, я наткнулся на некоторые довольно запутанные различия. Более конкретно, степени свободы в разных тестах различаются между PROC MIXEDи lme, и я задавался вопросом, почему. …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

2
Аппроксимирующие интегралы с использованием моделирования Монте-Карло в R
Как мне аппроксимировать следующий интеграл с помощью симуляции MC? ∫1−1∫1−1|x−y|dxdy∫−11∫−11|x−y|dxdy \int_{-1}^{1} \int_{-1}^{1} |x-y| \,\mathrm{d}x \,\mathrm{d}y Благодарность! Редактировать (в некотором контексте): я пытаюсь научиться использовать симуляцию для аппроксимации интегралов, и я получаю некоторую практику, когда сталкиваюсь с некоторыми трудностями. Правка 2 + 3 : Каким-то образом я запутался и подумал, что …

5
Лучшая классификация дефолта в логистической регрессии
Полное раскрытие: это домашнее задание. Я включил ссылку на набор данных ( http://www.bertelsen.ca/R/logistic-regression.sav ) Моя цель - максимально повысить прогноз неплательщиков кредитов в этом наборе данных. Каждая модель, которую я придумала до сих пор, предсказывает> 90% неплательщиков, но <40% неплательщиков, в целом эффективность классификации составляет ~ 80%. Итак, мне интересно, …
12 r  logistic  spss  self-study 

4
Что делает лассо нестабильным при выборе функции?
В сжатом восприятии есть теорема, гарантирующая, что имеет уникальное разреженное решение c (подробности см. В приложении).cargmin∥c∥1subject to y=Xcargmin‖c‖1subject to y=Xc\text{argmin} \Vert c \Vert_1\\ \text{subject to } y = Xc ccc Есть ли аналогичная теорема для лассо? Если такая теорема существует, она не только гарантирует стабильность лассо, но и дает лассо …

1
Причинный эффект при регулировке задней двери и передней двери
Если мы хотим вычислить причинное влияние на Y на приведенном ниже причинном графике, мы можем использовать как теоремы регулировки задней двери, так и теоремы регулировки передней двери, т. Е. P ( y | do ( X = x ) ) = ∑ u P ( y | x , u …

1
Точный критерий Фишера и гипергеометрическое распределение
Я хотел лучше понять точный критерий Фишера, поэтому я разработал следующий пример игрушки, где f и m соответствуют мужской и женской части, а n и y соответствуют «потреблению соды», например: > soda_gender f m n 0 5 y 5 0 Очевидно, это резкое упрощение, но я не хотел, чтобы контекст …

1
Доказательство того, что если существует более высокий момент, то существует и более низкий момент
-й момент случайной величины является конечным , если rrrXXXE(|Xr|)&lt;∞E(|Xr|)&lt;∞ \mathbb E(|X^r|)< \infty Я пытаюсь показать , что для любого натурального , то -го момента также конечно.s&lt;rs&lt;rs<rsssE[|Xs|]E[|Xs|]\mathbb E[|X^s|]

4
Бутстрап, Монте-Карло
Мне задали следующий вопрос в рамках домашней работы: Разработайте и внедрите имитационное исследование, чтобы изучить производительность начальной загрузки для получения 95% доверительных интервалов по среднему значению однофакторной выборки данных. Ваша реализация может быть в R или SAS. Аспектами эффективности, которые вы, возможно, захотите рассмотреть, являются покрытие доверительного интервала (т. Е. …

1
Как понять, что MLE дисперсии смещен в распределении Гаусса?
Я читаю PRML, и я не понимаю картину. Не могли бы вы дать несколько советов, чтобы понять картину и почему MLE дисперсии в распределении Гаусса смещены? формула 1.55: формула 1.56 σ 2 M L E =1μMLE=1N∑n=1NxnμMLE=1N∑n=1Nxn \mu_{MLE}=\frac{1}{N} \sum_{n=1}^N x_n σ2MLE=1N∑n=1N(xn−μMLE)2σMLE2=1N∑n=1N(xn−μMLE)2 \sigma_{MLE}^2=\frac{1}{N}\sum_{n=1}^{N}(x_n-\mu_{MLE})^2

3
Вывод регуляризованной функции стоимости линейной регрессии на курс Coursera Machine Learning
Я взял курс Эндрю Нг «Машинное обучение» через Coursera несколько месяцев назад, не обращая внимания на большую часть математики / дериваций и вместо этого сосредоточившись на практической реализации. С тех пор я начал возвращаться к изучению основополагающей теории и пересмотрел некоторые лекции профессора Нга. Я читал его лекцию «Регулярная линейная …

2
Предельная сумма iid гамма-вариаций
Пусть - последовательность независимых и одинаково распределенных случайных величин с функцией плотности вероятности; Покажите, чтоX1,X2,…X1,X2,…X_1,X_2,\ldotsf(x)={12x2e−x0if x&gt;0;otherwise.f(x)={12x2e−xif x&gt;0;0otherwise. f(x) = \left\{ \begin{array}{ll} \frac{1}{2}x^2 e^{-x} & \mbox{if $x>0$};\\ 0 & \mbox{otherwise}.\end{array} \right. limn→∞P[X1+X2+…+Xn≥3(n−n−−√)]≥12limn→∞P[X1+X2+…+Xn≥3(n−n)]≥12\lim_{n\to \infty} P[X_1+X_2+\ldots+X_n\ge 3(n-\sqrt{n})] \ge \frac{1}{2} Что я пытался На первый взгляд, я подумал, что следует использовать неравенство Чебышева, поскольку …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.