Статистика и большие данные

9

При обучении статистике использовать «нормальный» или «гауссовский»?

В своей книге я использую в основном «гауссовское распределение», но кто-то просто предложил мне перейти к «нормальному распределению». Какой консенсус по какому термину использовать для начинающих? Конечно, эти два термина являются синонимами , поэтому речь идет не о веществе, а о том, какой термин употребляется чаще. И конечно я использую …

42 normal-distribution terminology

5

Почему в среднем каждый образец начальной загрузки содержит примерно две трети наблюдений?

Я перебежать утверждение , что каждый образец самозагрузки (или в мешках дерево) будет содержать в среднем примерно 2/32/32/3 наблюдений. Я понимаю , что шанс не был выбран в любом из nnn черпает из nnn образцов с замены (1−1/n)n(1−1/n)n(1- 1/n)^n , которая работает примерно 1/31/31/3 шанс не был выбран. Что такое …

42 bootstrap

4

В чем разница между GARCH и ARMA?

Я запутался. Я не понимаю разницы между процессом ARMA и GARCH .. для меня то же самое нет? Вот процесс (G) ARCH (p, q) σ2t=α0+∑i=1qαir2t−iARCH+∑i=1pβiσ2t−iGARCHσt2=α0+∑i=1qαirt−i2⏟ARCH+∑i=1pβiσt−i2⏟GARCH\sigma_t^2 = \underbrace{ \underbrace{ \alpha_0 + \sum_{i=1}^q \alpha_ir_{t-i}^2} _{ARCH} + \sum_{i=1}^p\beta_i\sigma_{t-i}^2} _{GARCH} А вот и ARMA ( ):p,qp,qp, q Xt=c+εt+∑i=1pφiXt−i+∑i=1qθiεt−i.Xt=c+εt+∑i=1pφiXt−i+∑i=1qθiεt−i. X_t = c + \varepsilon_t + …

42 arima garch finance

2

Регрессия Пуассона для оценки относительного риска бинарных исходов

Краткое содержание Почему логистическая регрессия (с коэффициентами вероятности) чаще используется в когортных исследованиях с бинарными исходами, а не с пуассоновской регрессией (с относительными рисками)? Задний план Курсы по статистике и эпидемиологии для студентов и аспирантов, по моему опыту, обычно преподают, что логистическая регрессия должна использоваться для моделирования данных с бинарными …

42 logistic poisson-distribution epidemiology odds-ratio relative-risk

2

Доверительный интервал для отбора проб Бернулли

У меня есть случайная выборка случайных величин Бернулли , где X i - iidrv и P ( X i = 1 ) = p , а p - неизвестный параметр.Икс1, , , ИксNX1...XNX_1 ... X_NИксяXiX_iп( Xя= 1 ) = рP(Xi=1)=pP(X_i = 1) = pпpp Очевидно, что можно найти оценку для …

42 confidence-interval binomial bernoulli-distribution

3

Какова целевая функция PCA?

Анализ основных компонентов может использовать матричную декомпозицию, но это всего лишь инструмент для достижения этой цели. Как бы вы нашли главные компоненты без использования матричной алгебры? Какова целевая функция (цель) и каковы ограничения?

42 pca

5

Какое значение имеют коэффициенты логистической регрессии?

В настоящее время я читаю статью, касающуюся места голосования и предпочтений при голосовании на выборах 2000 и 2004 годов. В нем есть диаграмма, которая отображает коэффициенты логистической регрессии. Из курсов лет назад и немного читаяЯ понимаю логистическую регрессию как способ описания взаимосвязи между несколькими независимыми переменными и двоичной переменной ответа. …

42 regression logistic interpretation

5

Является ли машинное обучение менее полезным для понимания причинности, и, следовательно, менее интересным для социальных наук?

Мое понимание различий между машинным обучением / другими методами статистического прогнозирования и видом статистики, которую используют ученые-социологи (например, экономисты), заключается в том, что экономисты, похоже, очень заинтересованы в понимании влияния одной или нескольких переменных - как с точки зрения величина и выявление причинно-следственных связей. Для этого вы в конечном итоге …

42 machine-learning econometrics

8

Как сделать обнаружение сообщества в взвешенной социальной сети / графике?

Мне интересно, может ли кто-нибудь предложить хорошие отправные точки, когда дело доходит до обнаружения сообщества / разбиения / кластеризации графа на графе, который имеет взвешенные , ненаправленные ребра. У рассматриваемого графа приблизительно 3 миллиона ребер, и каждое ребро выражает степень сходства между двумя вершинами, которые он соединяет. В частности, в …

42 clustering data-visualization networks partitioning modularity

5

Как сделать временной ряд стационарным?

Помимо учета различий, каковы другие методы создания нестационарных временных рядов, стационарных? Обычно говорят, что ряд « интегрирован по порядку p », если его можно сделать стационарным с помощью оператора запаздывания .(1−L)PXt(1−L)PXt(1-L)^P X_t

42 time-series stationarity

8

Как заставить людей лучше заботиться о данных?

На моем рабочем месте работают сотрудники из самых разных дисциплин, поэтому мы генерируем данные в самых разных формах. Следовательно, каждая команда разработала свою собственную систему хранения данных. Некоторые используют базы данных Access или SQL; некоторые команды (к моему ужасу) почти полностью зависят от электронных таблиц Excel. Часто форматы данных меняются …

42 dataset reproducible-research quality-control

5

Выявление приоры у экспертов

Как мне получить предварительные распределения от экспертов при подборе байесовской модели?

42 bayesian prior elicitation

6

Какой алгоритм используется в линейной регрессии?

Я обычно слышу о "обычных наименьших квадратах". Это наиболее широко используемый алгоритм, используемый для линейной регрессии? Есть ли причины использовать другой?

42 regression least-squares algorithms computational-statistics numerics

1

Нейронные сети: импульс изменения веса и снижение веса

Momentum используется для уменьшения колебаний веса в последовательных итерациях:αα\alpha Е(ш)шηΔ ωя( t + 1 ) = - η∂Е∂веся+ α Δ ωя( т ) ,Δωя(T+1)знак равно-η∂Е∂веся+αΔωя(T),\Delta\omega_i(t+1) = - \eta\frac{\partial E}{\partial w_i} + \alpha \Delta \omega_i(t), где - функция ошибки, - вектор весов, - скорость обучения.Е( ш )Е(вес)E({\bf w})весвес{\bf w}ηη\eta Снижение веса …

42 neural-networks optimization regularization gradient-descent

3

Имеет ли смысл вычислять корреляцию Пирсона или Спирмена между двумя булевыми векторами?

Есть два булевых вектора, которые содержат только 0 и 1. Если я вычислю корреляцию Пирсона или Спирмена, они значимы или разумны?

42 correlation binary-data pearson-r spearman-rho