Статистика и большие данные

Вопросы и ответы для людей, интересующихся статистикой, машинным обучением, анализом данных, интеллектуальным анализом данных и визуализацией данных


7
Расчет параметров бета-распределения с использованием среднего и дисперсии
Как я могу рассчитать параметры и для бета-распределения, если я знаю среднее значение и дисперсию, которые я хочу иметь в распределении? Примеры команды R для этого были бы наиболее полезны.βαα\alphaββ\beta

2
Практические вопросы по настройке случайных лесов
Мои вопросы о случайных лесах. Концепция этого красивого классификатора мне ясна, но все же есть много практических вопросов использования. К сожалению, мне не удалось найти никакого практического руководства по ВЧ (я искал что-то вроде «Практического руководства по обучению машин Больцмана с ограничениями» Джеффри Хинтона, но для «Случайных лесов»!) Как можно …

4
В чем разница между «функцией связи» и «канонической функцией связи» для GLM
В чем разница между терминами «функция связи» и «функция канонического соединения»? Кроме того, есть ли (теоретические) преимущества использования одного над другим? Например, двоичная переменная ответа может быть смоделирована с использованием многих функций связи, таких как logit , probit и т. Д. Но логит здесь считается «канонической» функцией связи.

18
Статистика интервью вопросы
Я ищу некоторые статистические (и, вероятно, вероятностные) вопросы для интервью, от самых простых до более продвинутых. Ответы не обязательны (хотя ссылки на конкретные вопросы на этом сайте вполне подойдут).

4
Что такое «момент» о «моментах» распределения вероятностей?
Я ЗНАЮ, что такое моменты и как их вычислять и как использовать функцию генерации моментов для получения моментов более высокого порядка. Да, я знаю математику. Теперь, когда мне нужно смазать свои статистические знания для работы, я подумал, что с таким же успехом могу задать этот вопрос - это мучало меня …


5
Единый взгляд на усадку: какова связь (если таковая имеется) между парадоксом Штейна, регрессией гребня и случайными эффектами в смешанных моделях?
Рассмотрим следующие три явления. Парадокс Штейна: учитывая некоторые данные из многомерного нормального распределения в Rn,n≥3Rn,n≥3\mathbb R^n, \: n\ge 3 , среднее значение выборки не очень хорошая оценка истинного среднего. Можно получить оценку с меньшей среднеквадратичной ошибкой, если уменьшить все координаты среднего значения выборки до нуля [или в сторону их среднего …

5
Как интерпретировать обратную ковариацию или прецизионную матрицу?
Мне было интересно, может ли кто-нибудь указать мне некоторые ссылки, которые обсуждают интерпретацию элементов обратной ковариационной матрицы, также известной как матрица концентрации или прецизионная матрица. У меня есть доступ к многовариантным зависимостям Кокса и Вермута , но мне нужна интерпретация каждого элемента в обратной матрице. Википедия утверждает : «Элементы матрицы …

5
Какая функция потерь для задач мультиклассовой классификации с несколькими метками в нейронных сетях?
Я тренирую нейронную сеть, чтобы классифицировать набор объектов в n-классы. Каждый объект может принадлежать нескольким классам одновременно (несколько классов, несколько меток). Я читал, что для многоклассовых задач обычно рекомендуется использовать softmax и категориальную кросс-энтропию в качестве функции потерь вместо mse, и я более или менее понимаю, почему. Для моей проблемы …

12
Почему нейронным сетям нужно так много обучающих примеров для выполнения?
Ребенку в возрасте 2 лет требуется около 5 экземпляров автомобиля, чтобы можно было с достаточной точностью идентифицировать его, независимо от цвета, марки и т. Д. Когда моему сыну было 2 года, он смог опознать трамваи и поезда, даже если он видел немного. Поскольку он обычно путал друг друга, очевидно, его …

8
Является ли язык R надежным в области экономики?
Я аспирант по экономике, который недавно перешел на R из других очень известных статистических пакетов (в основном я использовал SPSS). На данный момент моя маленькая проблема в том, что я единственный пользователь R в своем классе. Мои одноклассники используют Stata и Gauss, и один из моих профессоров даже сказал, что …

4
Как добавление второго IV может сделать первое IV значимым?
У меня, наверное, простой вопрос, но он меня сейчас озадачивает, поэтому я надеюсь, что вы мне поможете. У меня есть модель регрессии наименьших квадратов, с одной независимой переменной и одной зависимой переменной. Отношения не значительны. Теперь я добавляю вторую независимую переменную. Теперь связь между первой независимой переменной и зависимой переменной …

8
Что является хорошим, убедительным примером, в котором p-значения полезны?
Мой вопрос в названии говорит сам за себя, но я хотел бы дать ему некоторый контекст. Ранее на этой неделе ASA опубликовала заявление « о p-значениях: контекст, процесс и цель », в котором изложены различные распространенные заблуждения о p-значении и содержится настоятельная рекомендация не использовать его без контекста и обдумывания …

1
Как интерпретировать коэффициенты в регрессии Пуассона?
Как я могу интерпретировать основные эффекты (коэффициенты для фиктивного фактора) в регрессии Пуассона? Предположим следующий пример: treatment <- factor(rep(c(1, 2), c(43, 41)), levels = c(1, 2), labels = c("placebo", "treated")) improved <- factor(rep(c(1, 2, 3, 1, 2, 3), c(29, 7, 7, 13, 7, 21)), levels = c(1, 2, 3), labels …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.