Статистика и большие данные

Вопросы и ответы для людей, интересующихся статистикой, машинным обучением, анализом данных, интеллектуальным анализом данных и визуализацией данных

10
Кто частые?
У нас уже была ветка, спрашивающая, кто такие байесовцы, и одна, спрашивающая, являются ли частые лица байесовскими , но не было ветки, спрашивающей, кто такие частые ? Этот вопрос был задан @whuber в качестве комментария к этой теме, и он требует ответа. Существуют ли они (есть ли самоидентифицированные частисты)? Может …

3
Что такого крутого в теореме о представлении де Финетти?
Из теории статистики Марка Дж. Шервиша (стр. 12): Хотя теорема ДеФинетти о представлении 1.49 является центральной для мотивации параметрических моделей, она фактически не используется в их реализации. Как теорема является центральной в параметрических моделях?

3
Вопросы о том, как случайные эффекты указаны в lmer
Недавно я измерил, как значение нового слова приобретается после многократных воздействий (практика: день с 1 по 10) путем измерения ERP (ЭЭГ), когда слово рассматривалось в разных контекстах. Я также контролировал свойства контекста, например, его полезность для открытия нового значения слова (высокий или низкий). Меня особенно интересует эффект от практики (дней). …


9
Расширенные рекомендации по статистике книг
На этом сайте есть несколько веток для рекомендаций по вводной статистике и машинному обучению, но я ищу текст по расширенной статистике, в том числе в порядке приоритета: максимальная вероятность, обобщенные линейные модели, анализ главных компонентов, нелинейные модели . Я пробовал Статистические Модели AC Davison, но, честно говоря, мне пришлось записать …

6
Альтернативы логистической регрессии в R
Мне бы хотелось, чтобы столько алгоритмов выполняли ту же задачу, что и логистическая регрессия. Это алгоритмы / модели, которые могут дать прогноз двоичного ответа (Y) с некоторой пояснительной переменной (X). Я был бы рад, если после того, как вы назовете алгоритм, если вы также покажете, как реализовать его в R. …

7
Какую меру псевдо-
У меня есть SPSSвыход для модели логистической регрессии. Выходные данные сообщают о двух мерах для подгонки модели, Cox & Snellи Nagelkerke. Так что, как правило, какие из этих мер вы бы сообщили, как модель подходит?R2R²R^² Или какой из этих индексов соответствия обычно сообщается в журналах? Немного предыстории: регрессия пытается предсказать …

5
Центральная предельная теорема для выборочных медиан
Если я вычислю медиану достаточно большого числа наблюдений, взятых из одного и того же распределения, будет ли в центральной предельной теореме аппроксимация распределения медиан приближаться к нормальному? Насколько я понимаю, это верно для большого количества образцов, но верно ли это для медиан? Если нет, каково основное распределение выборочных медиан?

2
Что такое глобальный уровень максимального пула и в чем его преимущество перед уровнем максимального пула?
Может кто-нибудь объяснить, что такое глобальный уровень максимального пула и почему и когда мы используем его для обучения нейронной сети. Есть ли у них какое-либо преимущество перед обычным максимальным слоем пула?

3
Понимание стратифицированной перекрестной проверки
В чем разница между стратифицированной перекрестной проверкой и перекрестной проверкой ? Википедия говорит: При перекрестной проверке по многослойной k-кратности сгибы выбираются таким образом, чтобы среднее значение отклика было примерно одинаковым во всех сгибах. В случае дихотомической классификации это означает, что каждая складка содержит примерно одинаковые пропорции двух типов меток классов. …

5
Использование глубокого обучения для прогнозирования временных рядов
Я новичок в области глубокого обучения, и для меня первым шагом было прочитать интересные статьи с сайта deeplearning.net. В статьях о глубоком обучении Хинтон и другие в основном говорят о применении его к проблемам изображения. Может кто-нибудь попытаться ответить мне, может ли это быть применено к проблеме прогнозирования значений временных …

2
Основной вопрос о информационной матрице Фишера и связи с гессианскими и стандартными ошибками
Хорошо, это довольно простой вопрос, но я немного запутался. В своей диссертации я пишу: Стандартные ошибки могут быть найдены путем вычисления обратного корня квадратного из диагональных элементов (наблюдаемой) информационной матрицы Фишера: Так как команда оптимизации в R сводитминимуму-журналл(наблюдаемые) Фишера Информационная матрица может быть найдена путем вычисления обратной гессианом: Я(μ,сг2)=Н-1sμ^, σ^2= …

2
Реальные примеры процессов скользящих средних
Можете ли вы привести некоторые примеры из реальной жизни временных рядов, для которых процесс скользящего среднего порядка : есть какая- то априорная причина быть хорошей моделью? По крайней мере, для меня авторегрессионные процессы кажутся интуитивно понятными, в то время как процессы МА не кажутся естественными на первый взгляд. Обратите внимание, …

9
Как R и Python дополняют друг друга в науке о данных?
Похоже, что во многих руководствах или руководствах описательная часть R и python сосуществуют как дополнительные компоненты процесса анализа. Однако на мой неподготовленный взгляд кажется, что оба языка делают одно и то же. Поэтому мой вопрос: существуют ли действительно специализированные ниши для двух языков или это просто личное предпочтение - использовать …
54 r  python  software 

9
Преувеличиваем ли мы важность допущения и оценки модели в эпоху, когда анализ часто проводится неспециалистами?
Итог : чем больше я узнаю о статистике, тем меньше я доверяю опубликованным работам в своей области; Я просто считаю, что исследователи недостаточно хорошо справляются со своей статистикой. Я мирянин, так сказать. Я обучаюсь биологии, но у меня нет формального образования в области статистики или математики. Я наслаждаюсь R и …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.