Статистика и большие данные

Вопросы и ответы для людей, интересующихся статистикой, машинным обучением, анализом данных, интеллектуальным анализом данных и визуализацией данных

3
Разница между СВМ и персептроном
Меня немного смущает разница между SVM и персептроном. Позвольте мне попытаться суммировать мое понимание здесь, и, пожалуйста, не стесняйтесь исправить, где я ошибаюсь, и заполнить то, что я пропустил. Перцептрон не пытается оптимизировать разделение «расстояния». Пока он находит гиперплоскость, которая разделяет два набора, это хорошо. SVM, с другой стороны, пытается …

1
Лучшие методы извлечения факторов в факторном анализе
SPSS предлагает несколько методов извлечения факторов: Основные компоненты (что вовсе не факторный анализ) Невзвешенные наименьшие квадраты Обобщенные наименьшие квадраты Максимальная вероятность Основная ось Альфа-факторинг Имиджевый факторинг Не обращая внимания на первый метод, который не является факторным анализом (но анализ основных компонентов, PCA), какой из этих методов является «лучшим»? Каковы относительные …

2
Разница между наивным байесовским и многочленным наивным байесовским
Я имел дело с наивным байесовским классификатором раньше. В последнее время я читаю о многокомном наивном байесовском . Также Задняя Вероятность = (Приоритет * Вероятность) / (Доказательства) . Единственное главное отличие (при программировании этих классификаторов), которое я обнаружил между наивным байесовским и многочленным наивным байесовским, состоит в том, что Наивный …

1
Различия между статистической моделью и моделью вероятности?
Прикладная вероятность - важная ветвь в вероятности, включая вычислительную вероятность. Поскольку статистика использует теорию вероятностей для построения моделей для работы с данными, насколько я понимаю, мне интересно, в чем принципиальная разница между статистической моделью и моделью вероятности? Вероятностная модель не нуждается в реальных данных? Спасибо.

3
Интерпретация простых прогнозов отношения шансов в логистической регрессии
Я немного новичок в использовании логистической регрессии, и меня немного смущает расхождение между моими интерпретациями следующих значений, которые, по моему мнению, будут одинаковыми: возведенные в степень значения беты прогнозируемая вероятность результата с использованием бета-значений. Вот упрощенная версия модели, которую я использую, где недоедание и страхование являются двоичными, а богатство непрерывным: …

3
Какая разница в том, что AIC и c-статистика (AUC) фактически измеряют для подгонки модели?
Информационный критерий Акаике (AIC) и c-статистика (площадь под кривой ROC) являются двумя показателями модели, пригодными для логистической регрессии. У меня возникают проблемы с объяснением того, что происходит, когда результаты двух измерений не совпадают. Я предполагаю, что они измеряют немного различные аспекты подгонки модели, но каковы эти конкретные аспекты? У меня …
29 logistic  roc  aic  auc 

1
СВД коррелированной матрицы должен быть аддитивным, но не
Я просто пытаюсь воспроизвести утверждение, сделанное в следующей статье « Поиск коррелированных бикластеров по данным экспрессии генов» : Предложение 4. Если . тогда мы имеем:XIJ=RICTJXIJ=RICJTX_{IJ}=R_{I}C^{T}_{J} я. Если - идеальный бикластер с аддитивной моделью, то - идеальный бикластер с корреляцией по столбцам; II. Если - идеальный бикластер с аддитивной моделью, то …

4
Простой способ алгоритмически идентифицировать всплеск зарегистрированных ошибок
Нам нужна система раннего предупреждения. Я имею дело с сервером, который, как известно, имеет проблемы с производительностью под нагрузкой. Ошибки записываются в базу данных вместе с отметкой времени. Есть некоторые шаги ручного вмешательства, которые могут быть предприняты, чтобы уменьшить нагрузку на сервер, но только если кто-то знает о проблеме ... …

3
Чем распределение Пуассона отличается от нормального распределения?
Этот вопрос был перенесен из переполнения стека, потому что на него можно ответить по перекрестной проверке. Мигрировал 7 лет назад . Я сгенерировал вектор, который имеет распределение Пуассона, следующим образом: x = rpois(1000,10) Если я использую гистограмму hist(x), распределение выглядит как знакомое нормальное распределение в форме колокольчика. Однако в одном …

3
Какой тест я могу использовать для сравнения уклонов двух или более регрессионных моделей?
Я хотел бы проверить разницу в ответе двух переменных на один предиктор. Вот минимальный воспроизводимый пример. library(nlme) ## gls is used in the application; lm would suffice for this example m.set <- gls(Sepal.Length ~ Petal.Width, data = iris, subset = Species == "setosa") m.vir <- gls(Sepal.Length ~ Petal.Width, data = …

2
Вычислить матрицу перехода (Маркова) в R
Есть ли способ в R (встроенная функция) вычислить матрицу переходов для цепи Маркова из набора наблюдений? Например, взять набор данных, подобный следующему, и вычислить матрицу перехода первого порядка? dat<-data.frame(replicate(20,sample(c("A", "B", "C","D"), size = 100, replace=TRUE)))
29 r  markov-process 

4
Пакеты R для выполнения тематического моделирования / LDA: просто `topicmodels` и` lda` [закрыто]
Закрыто. Этот вопрос не по теме . В настоящее время не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто в прошлом году . Мне кажется, что только два пакета R способны выполнять скрытое выделение Дирихле : Один из них lda, автор Джонатан Чанг; …

3
Хорошие учебные пособия по гиббсу
Я хочу узнать, как работает выборка Гиббса, и я ищу хорошую базовую и промежуточную статью. У меня есть опыт работы в области компьютерных наук и базовые статистические знания. Кто-нибудь прочитал хороший материал вокруг? где ты это узнал? Благодарность
29 references  gibbs 

6
Интерпретация теста Шапиро-Вилка
Я довольно плохо знаком со статистикой, и мне нужна ваша помощь. У меня есть небольшой образец, как показано ниже: H4U 0.269 0.357 0.2 0.221 0.275 0.277 0.253 0.127 0.246 Я выполнил тест Шапиро-Уилка, используя R: shapiro.test(precisionH4U$H4U) и я получил следующий результат: W = 0.9502, p-value = 0.6921 Теперь, если я …

2
Подгонка модели ARIMAX с регуляризацией или штрафом (например, с помощью лассо, эластичной сетки или регрессии гребня)
Я использую функцию auto.arima () в пакете прогноза для подбора моделей ARMAX с различными ковариатами. Тем не менее, у меня часто есть большое количество переменных для выбора, и обычно получается окончательная модель, которая работает с их подмножеством. Мне не нравятся специальные методы для выбора переменных, потому что я человек и …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.