Статистика и большие данные

Вопросы и ответы для людей, интересующихся статистикой, машинным обучением, анализом данных, интеллектуальным анализом данных и визуализацией данных

9
При обучении статистике использовать «нормальный» или «гауссовский»?
В своей книге я использую в основном «гауссовское распределение», но кто-то просто предложил мне перейти к «нормальному распределению». Какой консенсус по какому термину использовать для начинающих? Конечно, эти два термина являются синонимами , поэтому речь идет не о веществе, а о том, какой термин употребляется чаще. И конечно я использую …

5
Почему в среднем каждый образец начальной загрузки содержит примерно две трети наблюдений?
Я перебежать утверждение , что каждый образец самозагрузки (или в мешках дерево) будет содержать в среднем примерно 2/32/32/3 наблюдений. Я понимаю , что шанс не был выбран в любом из nnn черпает из nnn образцов с замены (1−1/n)n(1−1/n)n(1- 1/n)^n , которая работает примерно 1/31/31/3 шанс не был выбран. Что такое …
42 bootstrap 

4
В чем разница между GARCH и ARMA?
Я запутался. Я не понимаю разницы между процессом ARMA и GARCH .. для меня то же самое нет? Вот процесс (G) ARCH (p, q) σ2t=α0+∑i=1qαir2t−iARCH+∑i=1pβiσ2t−iGARCHσt2=α0+∑i=1qαirt−i2⏟ARCH+∑i=1pβiσt−i2⏟GARCH\sigma_t^2 = \underbrace{ \underbrace{ \alpha_0 + \sum_{i=1}^q \alpha_ir_{t-i}^2} _{ARCH} + \sum_{i=1}^p\beta_i\sigma_{t-i}^2} _{GARCH} А вот и ARMA ( ):p,qp,qp, q Xt=c+εt+∑i=1pφiXt−i+∑i=1qθiεt−i.Xt=c+εt+∑i=1pφiXt−i+∑i=1qθiεt−i. X_t = c + \varepsilon_t + …
42 arima  garch  finance 

2
Регрессия Пуассона для оценки относительного риска бинарных исходов
Краткое содержание Почему логистическая регрессия (с коэффициентами вероятности) чаще используется в когортных исследованиях с бинарными исходами, а не с пуассоновской регрессией (с относительными рисками)? Задний план Курсы по статистике и эпидемиологии для студентов и аспирантов, по моему опыту, обычно преподают, что логистическая регрессия должна использоваться для моделирования данных с бинарными …

2
Доверительный интервал для отбора проб Бернулли
У меня есть случайная выборка случайных величин Бернулли , где X i - iidrv и P ( X i = 1 ) = p , а p - неизвестный параметр.Икс1, , , ИксNX1...XNX_1 ... X_NИксяXiX_iп( Xя= 1 ) = рP(Xi=1)=pP(X_i = 1) = pпpp Очевидно, что можно найти оценку для …

3
Какова целевая функция PCA?
Анализ основных компонентов может использовать матричную декомпозицию, но это всего лишь инструмент для достижения этой цели. Как бы вы нашли главные компоненты без использования матричной алгебры? Какова целевая функция (цель) и каковы ограничения?
42 pca 

5
Какое значение имеют коэффициенты логистической регрессии?
В настоящее время я читаю статью, касающуюся места голосования и предпочтений при голосовании на выборах 2000 и 2004 годов. В нем есть диаграмма, которая отображает коэффициенты логистической регрессии. Из курсов лет назад и немного читаяЯ понимаю логистическую регрессию как способ описания взаимосвязи между несколькими независимыми переменными и двоичной переменной ответа. …

5
Является ли машинное обучение менее полезным для понимания причинности, и, следовательно, менее интересным для социальных наук?
Мое понимание различий между машинным обучением / другими методами статистического прогнозирования и видом статистики, которую используют ученые-социологи (например, экономисты), заключается в том, что экономисты, похоже, очень заинтересованы в понимании влияния одной или нескольких переменных - как с точки зрения величина и выявление причинно-следственных связей. Для этого вы в конечном итоге …

8
Как сделать обнаружение сообщества в взвешенной социальной сети / графике?
Мне интересно, может ли кто-нибудь предложить хорошие отправные точки, когда дело доходит до обнаружения сообщества / разбиения / кластеризации графа на графе, который имеет взвешенные , ненаправленные ребра. У рассматриваемого графа приблизительно 3 миллиона ребер, и каждое ребро выражает степень сходства между двумя вершинами, которые он соединяет. В частности, в …

5
Как сделать временной ряд стационарным?
Помимо учета различий, каковы другие методы создания нестационарных временных рядов, стационарных? Обычно говорят, что ряд « интегрирован по порядку p », если его можно сделать стационарным с помощью оператора запаздывания .(1−L)PXt(1−L)PXt(1-L)^P X_t

8
Как заставить людей лучше заботиться о данных?
На моем рабочем месте работают сотрудники из самых разных дисциплин, поэтому мы генерируем данные в самых разных формах. Следовательно, каждая команда разработала свою собственную систему хранения данных. Некоторые используют базы данных Access или SQL; некоторые команды (к моему ужасу) почти полностью зависят от электронных таблиц Excel. Часто форматы данных меняются …



1
Нейронные сети: импульс изменения веса и снижение веса
Momentum используется для уменьшения колебаний веса в последовательных итерациях:αα\alpha Е(ш)шηΔ ωя( t + 1 ) = - η∂Е∂веся+ α Δ ωя( т ) ,Δωя(T+1)знак равно-η∂Е∂веся+αΔωя(T),\Delta\omega_i(t+1) = - \eta\frac{\partial E}{\partial w_i} + \alpha \Delta \omega_i(t), где - функция ошибки, - вектор весов, - скорость обучения.Е( ш )Е(вес)E({\bf w})весвес{\bf w}ηη\eta Снижение веса …


Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.