Статистика и большие данные

Вопросы и ответы для людей, интересующихся статистикой, машинным обучением, анализом данных, интеллектуальным анализом данных и визуализацией данных

6
Если вероятный интервал имеет ровный априор, равен ли доверительный интервал 95% доверительному интервалу 95%?
Я очень плохо знаком с байесовской статистикой, и это может быть глупым вопросом. тем не менее: Рассмотрим вероятный интервал с априором, который определяет равномерное распределение. Например, от 0 до 1, где от 0 до 1 представляет полный диапазон возможных значений эффекта. В этом случае будет ли доверительный интервал 95% равным …

7
Почему точность проверки колеблется?
У меня есть четырехслойный CNN для прогнозирования ответа на рак с использованием данных МРТ. Я использую активацию ReLU для введения нелинейностей. Точность и потеря поезда монотонно увеличиваются и уменьшаются соответственно. Но точность моего теста начинает сильно колебаться. Я попытался изменить скорость обучения, уменьшить количество слоев. Но это не останавливает колебания. …

1
Неправильное использование перекрестной проверки (представление отчета о наилучшем значении гиперпараметра)
Недавно я натолкнулся на статью, в которой предлагается использовать классификатор k-NN для конкретного набора данных. Авторы использовали все доступные образцы данных, чтобы выполнить перекрестную проверку в k-кратном размере для различных значений k и сообщить результаты перекрестной проверки наилучшей конфигурации гиперпараметра. Насколько мне известно, этот результат является предвзятым, и они должны …

2
Нужен ли градиентный спуск, чтобы найти коэффициенты модели линейной регрессии?
Я пытался научиться машинному обучению, используя материал Coursera . В этой лекции Эндрю Нг использует алгоритм градиентного спуска, чтобы найти коэффициенты модели линейной регрессии, которая минимизирует функцию ошибки (функцию стоимости). Для линейной регрессии нужен ли градиентный спуск? Кажется, я могу аналитически дифференцировать функцию ошибки и установить ее на ноль, чтобы …

3
Как Наивный Байес является линейным классификатором?
Я видел другую ветку здесь, но я не думаю, что ответ удовлетворил фактический вопрос. Я постоянно читал, что Наивный Байес - это линейный классификатор (например, здесь ) (такой, что он рисует линейную границу решения), использующий демонстрацию логических шансов. Однако я смоделировал два гауссовых облака и установил границу решения и получил …

4
Логистическая регрессия - срок ошибки и ее распределение
О том, существует ли термин ошибки в логистической регрессии (и его предполагаемом распределении), я читал в разных местах, что: Термин ошибки не существует термин ошибки имеет биномиальное распределение (в соответствии с распределением переменной ответа) термин ошибки имеет логистическое распределение Может кто-нибудь уточнить, пожалуйста?

4
Это правда, что процентиль бутстрап никогда не должен использоваться?
В примечаниях MIT OpenCourseWare к 18.05 «Введение в вероятность и статистику», весна 2014 г. (в настоящее время доступно здесь ), говорится: Метод процентиля начальной загрузки привлекателен своей простотой. Однако это зависит от начального распределения основанного на том, что конкретный образец является хорошим приближением к истинному распределению . Райс говорит о …

2
Относительная важность набора предикторов в классификации случайных лесов в R
Я хотел бы определить относительную важность наборов переменных для randomForestмодели классификации в R. importanceФункция предоставляет MeanDecreaseGiniметрику для каждого отдельного предиктора - это так же просто, как суммировать это для каждого предиктора в наборе? Например: # Assumes df has variables a1, a2, b1, b2, and outcome rf <- randomForest(outcome ~ ., …

3
Средняя квадратическая ошибка и остаточная сумма квадратов
Глядя на определения Википедии: Средняя квадратическая ошибка (MSE) Остаточная сумма квадратов (RSS) Мне кажется, что MSE = 1NRSS = 1N∑ ( фя- уя)2MSE=1NRSS=1N∑(fi−yi)2\text{MSE} = \frac{1}{N} \text{RSS} = \frac{1}{N} \sum (f_i -y_i)^2 где - это количество выборок, а - наша оценка .NNNеяfif_iYяyiy_i Тем не менее, ни одна из статей Википедии не …
31 residuals  mse 

4
Когда верна оценка предвзятости?
Часто утверждается, что начальная загрузка может дать оценку смещения в оценщике. Если т является оценкой для некоторой статистики, и ~ т я являюсь бутстраповскими репликами (с I ∈ { 1 , ⋯ , N } ), то оценкой смещения начальной загрузки является б я ы т ≈ -t^t^\hat tt~it~i\tilde t_ii∈{1,⋯,N}i∈{1,⋯,N}i\in\{1,\cdots,N\}biast≈1N∑it~i−t^biast≈1N∑it~i−t^\begin{equation} …
31 bootstrap  bias 

2
формат данных libsvm [закрыто]
Закрыто. Этот вопрос не по теме . В настоящее время не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыт 10 месяцев назад . Я использую инструмент libsvm ( http://www.csie.ntu.edu.tw/~cjlin/libsvm/ ) для классификации вспомогательных векторов. Однако меня смущает формат входных данных. Из README: Формат …

3
Можно ли рассчитать AIC и BIC для моделей лассо-регрессии?
Можно ли рассчитать значения AIC или BIC для моделей лассо-регрессии и других регуляризованных моделей, где параметры только частично входят в уравнение. Как определить степени свободы? Я использую R для подбора моделей регрессии Лассо с помощью glmnet()функции из glmnetпакета, и я хотел бы знать, как рассчитать значения AIC и BIC для …
31 r  model-selection  lasso  aic  bic 

1
Интуиция за взаимодействиями тензорных произведений в GAM (пакет MGCV в R)
Обобщенными аддитивными моделями являются те, где Y= α + f1( х1) + f2( х2) + еяy=α+f1(x1)+f2(x2)+ei y = \alpha + f_1(x_1) + f_2(x_2) + e_i например. функции гладкие и должны быть оценены. Обычно по штрафным сплайнам. MGCV - это пакет в R, который делает это, и автор (Саймон Вуд) пишет …

3
За каким распространением следуют мои данные?
Допустим, у меня есть 1000 компонентов, и я собираю данные о том, сколько раз они регистрируют сбой, и каждый раз, когда они регистрируют сбой, я также отслеживаю, сколько времени понадобилось моей команде, чтобы устранить проблему. Короче говоря, я записывал время ремонта (в секундах) для каждого из этих 1000 компонентов. Данные …

2
Необработанные остатки по сравнению со стандартизованными остатками по сравнению со студентизированными остатками - что использовать, когда?
Это похоже на похожий вопрос и не получил много ответов. Пропуская такие тесты, как D Кука, и просто рассматривая остатки как группу, мне интересно, как другие используют остатки при оценке пригодности. Я использую сырые остатки: в QQ-сюжете, для оценки нормальности на диаграмме рассеяния сравнению с остатками для проверки глазного яблока …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.