Статистика и большие данные

4

Как построить кривые ROC в мультиклассовой классификации?

Другими словами, вместо того, чтобы иметь проблему с двумя классами, я имею дело с 4 классами и все еще хотел бы оценить производительность, используя AUC.

66 classification roc

7

Расчет параметров бета-распределения с использованием среднего и дисперсии

Как я могу рассчитать параметры и для бета-распределения, если я знаю среднее значение и дисперсию, которые я хочу иметь в распределении? Примеры команды R для этого были бы наиболее полезны.βαα\alphaββ\beta

66 r distributions estimation beta-distribution

2

Практические вопросы по настройке случайных лесов

Мои вопросы о случайных лесах. Концепция этого красивого классификатора мне ясна, но все же есть много практических вопросов использования. К сожалению, мне не удалось найти никакого практического руководства по ВЧ (я искал что-то вроде «Практического руководства по обучению машин Больцмана с ограничениями» Джеффри Хинтона, но для «Случайных лесов»!) Как можно …

65 random-forest cart

4

В чем разница между «функцией связи» и «канонической функцией связи» для GLM

В чем разница между терминами «функция связи» и «функция канонического соединения»? Кроме того, есть ли (теоретические) преимущества использования одного над другим? Например, двоичная переменная ответа может быть смоделирована с использованием многих функций связи, таких как logit , probit и т. Д. Но логит здесь считается «канонической» функцией связи.

65 logistic generalized-linear-model link-function

18

Статистика интервью вопросы

Я ищу некоторые статистические (и, вероятно, вероятностные) вопросы для интервью, от самых простых до более продвинутых. Ответы не обязательны (хотя ссылки на конкретные вопросы на этом сайте вполне подойдут).

65 intuition careers

4

Что такое «момент» о «моментах» распределения вероятностей?

Я ЗНАЮ, что такое моменты и как их вычислять и как использовать функцию генерации моментов для получения моментов более высокого порядка. Да, я знаю математику. Теперь, когда мне нужно смазать свои статистические знания для работы, я подумал, что с таким же успехом могу задать этот вопрос - это мучало меня …

65 distributions terminology moments intuition

4

Где я должен разместить выпадающие слои в нейронной сети?

Существуют ли общие рекомендации о том, где размещать выпадающие слои в нейронной сети?

65 neural-networks dropout

5

Единый взгляд на усадку: какова связь (если таковая имеется) между парадоксом Штейна, регрессией гребня и случайными эффектами в смешанных моделях?

Рассмотрим следующие три явления. Парадокс Штейна: учитывая некоторые данные из многомерного нормального распределения в Rn,n≥3Rn,n≥3\mathbb R^n, \: n\ge 3 , среднее значение выборки не очень хорошая оценка истинного среднего. Можно получить оценку с меньшей среднеквадратичной ошибкой, если уменьшить все координаты среднего значения выборки до нуля [или в сторону их среднего …

65 regression mixed-model ridge-regression shrinkage steins-phenomenon

5

Как интерпретировать обратную ковариацию или прецизионную матрицу?

Мне было интересно, может ли кто-нибудь указать мне некоторые ссылки, которые обсуждают интерпретацию элементов обратной ковариационной матрицы, также известной как матрица концентрации или прецизионная матрица. У меня есть доступ к многовариантным зависимостям Кокса и Вермута , но мне нужна интерпретация каждого элемента в обратной матрице. Википедия утверждает : «Элементы матрицы …

65 interpretation covariance-matrix

5

Какая функция потерь для задач мультиклассовой классификации с несколькими метками в нейронных сетях?

Я тренирую нейронную сеть, чтобы классифицировать набор объектов в n-классы. Каждый объект может принадлежать нескольким классам одновременно (несколько классов, несколько меток). Я читал, что для многоклассовых задач обычно рекомендуется использовать softmax и категориальную кросс-энтропию в качестве функции потерь вместо mse, и я более или менее понимаю, почему. Для моей проблемы …

64 neural-networks python loss-functions keras cross-entropy

12

Почему нейронным сетям нужно так много обучающих примеров для выполнения?

Ребенку в возрасте 2 лет требуется около 5 экземпляров автомобиля, чтобы можно было с достаточной точностью идентифицировать его, независимо от цвета, марки и т. Д. Когда моему сыну было 2 года, он смог опознать трамваи и поезда, даже если он видел немного. Поскольку он обычно путал друг друга, очевидно, его …

64 neural-networks neuroscience

8

Является ли язык R надежным в области экономики?

Я аспирант по экономике, который недавно перешел на R из других очень известных статистических пакетов (в основном я использовал SPSS). На данный момент моя маленькая проблема в том, что я единственный пользователь R в своем классе. Мои одноклассники используют Stata и Gauss, и один из моих профессоров даже сказал, что …

64 r software econometrics

4

Как добавление второго IV может сделать первое IV значимым?

У меня, наверное, простой вопрос, но он меня сейчас озадачивает, поэтому я надеюсь, что вы мне поможете. У меня есть модель регрессии наименьших квадратов, с одной независимой переменной и одной зависимой переменной. Отношения не значительны. Теперь я добавляю вторую независимую переменную. Теперь связь между первой независимой переменной и зависимой переменной …

64 regression multiple-regression power suppressor

8

Что является хорошим, убедительным примером, в котором p-значения полезны?

Мой вопрос в названии говорит сам за себя, но я хотел бы дать ему некоторый контекст. Ранее на этой неделе ASA опубликовала заявление « о p-значениях: контекст, процесс и цель », в котором изложены различные распространенные заблуждения о p-значении и содержится настоятельная рекомендация не использовать его без контекста и обдумывания …

64 hypothesis-testing bayesian p-value inference frequentist

1

Как интерпретировать коэффициенты в регрессии Пуассона?

Как я могу интерпретировать основные эффекты (коэффициенты для фиктивного фактора) в регрессии Пуассона? Предположим следующий пример: treatment <- factor(rep(c(1, 2), c(43, 41)), levels = c(1, 2), labels = c("placebo", "treated")) improved <- factor(rep(c(1, 2, 3, 1, 2, 3), c(29, 7, 7, 13, 7, 21)), levels = c(1, 2, 3), labels …

64 r generalized-linear-model interpretation poisson-distribution regression-coefficients