Статистика и большие данные

10

У нас уже была ветка, спрашивающая, кто такие байесовцы, и одна, спрашивающая, являются ли частые лица байесовскими , но не было ветки, спрашивающей, кто такие частые ? Этот вопрос был задан @whuber в качестве комментария к этой теме, и он требует ответа. Существуют ли они (есть ли самоидентифицированные частисты)? Может …

55 bayesian frequentist

3

Что такого крутого в теореме о представлении де Финетти?

Из теории статистики Марка Дж. Шервиша (стр. 12): Хотя теорема ДеФинетти о представлении 1.49 является центральной для мотивации параметрических моделей, она фактически не используется в их реализации. Как теорема является центральной в параметрических моделях?

55 probability modeling mathematical-statistics parametric

3

Вопросы о том, как случайные эффекты указаны в lmer

Недавно я измерил, как значение нового слова приобретается после многократных воздействий (практика: день с 1 по 10) путем измерения ERP (ЭЭГ), когда слово рассматривалось в разных контекстах. Я также контролировал свойства контекста, например, его полезность для открытия нового значения слова (высокий или низкий). Меня особенно интересует эффект от практики (дней). …

55 r mixed-model lme4-nlme random-effects-model

3

Критика Жемчужной теории причинности

В 2000 году Иудея Перл опубликовала статью «Причинность» . Какие споры окружают эту работу? Каковы его основные критические замечания?

55 causality

9

На этом сайте есть несколько веток для рекомендаций по вводной статистике и машинному обучению, но я ищу текст по расширенной статистике, в том числе в порядке приоритета: максимальная вероятность, обобщенные линейные модели, анализ главных компонентов, нелинейные модели . Я пробовал Статистические Модели AC Davison, но, честно говоря, мне пришлось записать …

55 generalized-linear-model pca maximum-likelihood references saddlepoint-approximation

6

Альтернативы логистической регрессии в R

Мне бы хотелось, чтобы столько алгоритмов выполняли ту же задачу, что и логистическая регрессия. Это алгоритмы / модели, которые могут дать прогноз двоичного ответа (Y) с некоторой пояснительной переменной (X). Я был бы рад, если после того, как вы назовете алгоритм, если вы также покажете, как реализовать его в R. …

55 r regression logistic classification predictive-models

7

Какую меру псевдо-

У меня есть SPSSвыход для модели логистической регрессии. Выходные данные сообщают о двух мерах для подгонки модели, Cox & Snellи Nagelkerke. Так что, как правило, какие из этих мер вы бы сообщили, как модель подходит?R2R²R^² Или какой из этих индексов соответствия обычно сообщается в журналах? Немного предыстории: регрессия пытается предсказать …

55 logistic goodness-of-fit r-squared

5

Центральная предельная теорема для выборочных медиан

Если я вычислю медиану достаточно большого числа наблюдений, взятых из одного и того же распределения, будет ли в центральной предельной теореме аппроксимация распределения медиан приближаться к нормальному? Насколько я понимаю, это верно для большого количества образцов, но верно ли это для медиан? Если нет, каково основное распределение выборочных медиан?

55 normal-distribution mathematical-statistics sampling median central-limit-theorem

2

Что такое глобальный уровень максимального пула и в чем его преимущество перед уровнем максимального пула?

Может кто-нибудь объяснить, что такое глобальный уровень максимального пула и почему и когда мы используем его для обучения нейронной сети. Есть ли у них какое-либо преимущество перед обычным максимальным слоем пула?

55 neural-networks conv-neural-network pooling

3

Понимание стратифицированной перекрестной проверки

В чем разница между стратифицированной перекрестной проверкой и перекрестной проверкой ? Википедия говорит: При перекрестной проверке по многослойной k-кратности сгибы выбираются таким образом, чтобы среднее значение отклика было примерно одинаковым во всех сгибах. В случае дихотомической классификации это означает, что каждая складка содержит примерно одинаковые пропорции двух типов меток классов. …

55 cross-validation stratification

5

Использование глубокого обучения для прогнозирования временных рядов

Я новичок в области глубокого обучения, и для меня первым шагом было прочитать интересные статьи с сайта deeplearning.net. В статьях о глубоком обучении Хинтон и другие в основном говорят о применении его к проблемам изображения. Может кто-нибудь попытаться ответить мне, может ли это быть применено к проблеме прогнозирования значений временных …

54 time-series machine-learning prediction deep-learning deep-belief-networks

2

Основной вопрос о информационной матрице Фишера и связи с гессианскими и стандартными ошибками

Хорошо, это довольно простой вопрос, но я немного запутался. В своей диссертации я пишу: Стандартные ошибки могут быть найдены путем вычисления обратного корня квадратного из диагональных элементов (наблюдаемой) информационной матрицы Фишера: Так как команда оптимизации в R сводитминимуму-журналл(наблюдаемые) Фишера Информационная матрица может быть найдена путем вычисления обратной гессианом: Я(μ,сг2)=Н-1sμ^, σ^2= …

54 maximum-likelihood fisher-information

2

Реальные примеры процессов скользящих средних

Можете ли вы привести некоторые примеры из реальной жизни временных рядов, для которых процесс скользящего среднего порядка : есть какая- то априорная причина быть хорошей моделью? По крайней мере, для меня авторегрессионные процессы кажутся интуитивно понятными, в то время как процессы МА не кажутся естественными на первый взгляд. Обратите внимание, …

54 time-series arima interpretation moving-average

9

Как R и Python дополняют друг друга в науке о данных?

Похоже, что во многих руководствах или руководствах описательная часть R и python сосуществуют как дополнительные компоненты процесса анализа. Однако на мой неподготовленный взгляд кажется, что оба языка делают одно и то же. Поэтому мой вопрос: существуют ли действительно специализированные ниши для двух языков или это просто личное предпочтение - использовать …

54 r python software

9

Преувеличиваем ли мы важность допущения и оценки модели в эпоху, когда анализ часто проводится неспециалистами?

Итог : чем больше я узнаю о статистике, тем меньше я доверяю опубликованным работам в своей области; Я просто считаю, что исследователи недостаточно хорошо справляются со своей статистикой. Я мирянин, так сказать. Я обучаюсь биологии, но у меня нет формального образования в области статистики или математики. Я наслаждаюсь R и …

54 mathematical-statistics multiple-regression modeling