Статистика и большие данные

Вопросы и ответы для людей, интересующихся статистикой, машинным обучением, анализом данных, интеллектуальным анализом данных и визуализацией данных

27
Парадокс Спящей Красавицы
Ситуация Некоторые исследователи хотели бы усыпить вас. В зависимости от секретного броска справедливой монеты, они кратко разбудят вас один раз (головы) или два раза (хвосты). После каждого пробуждения они возвращают вас спать с лекарством, которое заставляет вас забыть это пробуждение. Когда вы проснетесь, в какой степени вы должны верить, что …

8
Почему метод Ньютона не широко используется в машинном обучении?
Это то, что беспокоило меня какое-то время, и я не смог найти удовлетворительных ответов в Интернете, так что вот так: После рассмотрения ряда лекций по выпуклой оптимизации метод Ньютона, по-видимому, является гораздо более совершенным алгоритмом, чем градиентный спуск, для поиска глобально оптимальных решений, поскольку метод Ньютона может обеспечить гарантию его …

4
Каппа Коэна на простом английском
Я читаю книгу по интеллектуальному анализу данных, в которой упоминается статистика Каппа как средство оценки эффективности прогнозирования классификаторов. Однако я просто не могу этого понять. Я также проверил Википедию, но это тоже не помогло: https://en.wikipedia.org/wiki/Cohen's_kappa . Как каппа Коэна помогает в оценке эффективности прогнозирования классификаторов? Что это говорит? Я понимаю, …

14
Являются ли большие наборы данных неподходящими для проверки гипотез?
В недавней статье в Amstat Новости , авторы (Марк ван дер Лан и Шерри Роуз) заявил , что «Мы знаем , что для достаточно больших размеров выборки, каждое исследование, в том числе те , в которых нулевая гипотеза об отсутствии эффекта верно - будет объявить статистически значимый эффект. Ну, я, …

6
Какая разница между дисперсией и стандартным отклонением?
Мне было интересно, какова разница между дисперсией и стандартным отклонением. Если вы рассчитываете два значения, становится ясно, что вы получаете стандартное отклонение от дисперсии, но что это означает с точки зрения распределения, которое вы наблюдаете? Кроме того, зачем вам стандартное отклонение?

9
Объяснение расстояния Махаланобиса снизу вверх?
Я изучаю распознавание образов и статистику, и почти в каждой книге, которую я открываю на эту тему, я сталкиваюсь с концепцией расстояния Махаланобиса . Книги дают интуитивно понятные объяснения, но все еще недостаточно хороши для того, чтобы я действительно мог понять, что происходит. Если бы кто-то спросил меня: «Каково расстояние …

9
Получение знаний из случайного леса
Случайные леса считаются черными ящиками, но недавно я подумал, какие знания можно получить из случайного леса? Наиболее очевидной вещью является важность переменных, в простейшем варианте это можно сделать, просто рассчитав количество вхождений переменной. Второе, о чем я думал, это взаимодействие. Я думаю, что если количество деревьев достаточно велико, можно проверить …

3
В чем разница между непротиворечивой оценкой и объективной оценкой?
Я действительно удивлен, что никто, кажется, не спросил это уже ... При обсуждении оценщиков часто используются два термина: «последовательный» и «беспристрастный». Мой вопрос прост: какая разница? Точные технические определения этих терминов довольно сложны, и сложно понять, что они означают . Я могу представить себе хорошую оценку и плохую оценку, но …

3
Помогите мне понять байесовские априорные и последующие распределения
В группе студентов 2 из 18 левши. Найти апостериорное распределение учеников-левшей в популяции, предполагая неинформативный априорный анализ. Подведите итоги. По данным литературы, 5-20% людей - левши. Примите эту информацию во внимание в вашем предыдущем и вычислите новое заднее. Я знаю, что бета-дистрибутив должен быть использован здесь. Во-первых, значения и равны …

4
В чем разница между сверточными нейронными сетями, ограниченными машинами Больцмана и автокодерами?
Недавно я читал о глубоком обучении, и я запутался в терминах (или, скажем, технологиях). В чем разница между Сверточные нейронные сети (CNN), Ограниченные машины Больцмана (RBM) и Авто-кодеры?

6
Корреляции с неупорядоченными категориальными переменными
У меня есть датафрейм со многими наблюдениями и многими переменными. Некоторые из них являются категориальными (неупорядоченными), а другие числовыми. Я ищу ассоциации между этими переменными. Я был в состоянии вычислить корреляцию для числовых переменных (корреляция Спирмена), но: Я не знаю, как измерить корреляцию между неупорядоченными категориальными переменными. Я не знаю, …


3
Зачем нам нужны сигма-алгебры для определения вероятностных пространств?
У нас есть случайный эксперимент с различными результатами , образующих пространство образца Ω ,Ω,\Omega, на котором мы смотрим с интересом на некоторые модели, под названием события F,F.\mathscr{F}. Сигма-алгебры (или сигма-поля) состоят из событий, которым может быть назначена мера вероятности пP\mathbb{P}Определенные свойства выполняются, включая включение нулевого множества ∅∅\varnothing и всего выборочного …

21
На каждом шаге ограничивающего бесконечного процесса, поместите 10 шаров в урну и удалите один наугад. Сколько шаров осталось?
Вопрос (слегка измененный) выглядит следующим образом, и, если вы никогда не сталкивались с ним раньше, вы можете проверить его в примере 6a, глава 2, « Первый курс вероятности» Шелдона Росса : Предположим, что у нас есть бесконечно большая урна и бесконечный набор шаров, помеченных как шар номер 1, номер 2, …

5
Как выбрать соотношение Пирсона и Спирмена?
Как я знаю , когда выбирать между Спирменом и Пирсоном ? Моя переменная включает в себя удовлетворенность, и оценки были интерпретированы с использованием суммы оценок. Тем не менее, эти оценки также могут быть ранжированы.гρρ\rhoррr

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.