Статистика и большие данные

3

Меня немного смущает разница между SVM и персептроном. Позвольте мне попытаться суммировать мое понимание здесь, и, пожалуйста, не стесняйтесь исправить, где я ошибаюсь, и заполнить то, что я пропустил. Перцептрон не пытается оптимизировать разделение «расстояния». Пока он находит гиперплоскость, которая разделяет два набора, это хорошо. SVM, с другой стороны, пытается …

29 machine-learning svm kernel-trick

1

Лучшие методы извлечения факторов в факторном анализе

SPSS предлагает несколько методов извлечения факторов: Основные компоненты (что вовсе не факторный анализ) Невзвешенные наименьшие квадраты Обобщенные наименьшие квадраты Максимальная вероятность Основная ось Альфа-факторинг Имиджевый факторинг Не обращая внимания на первый метод, который не является факторным анализом (но анализ основных компонентов, PCA), какой из этих методов является «лучшим»? Каковы относительные …

29 spss pca factor-analysis

2

Разница между наивным байесовским и многочленным наивным байесовским

Я имел дело с наивным байесовским классификатором раньше. В последнее время я читаю о многокомном наивном байесовском . Также Задняя Вероятность = (Приоритет * Вероятность) / (Доказательства) . Единственное главное отличие (при программировании этих классификаторов), которое я обнаружил между наивным байесовским и многочленным наивным байесовским, состоит в том, что Наивный …

29 bayesian classification text-mining naive-bayes

1

Различия между статистической моделью и моделью вероятности?

Прикладная вероятность - важная ветвь в вероятности, включая вычислительную вероятность. Поскольку статистика использует теорию вероятностей для построения моделей для работы с данными, насколько я понимаю, мне интересно, в чем принципиальная разница между статистической моделью и моделью вероятности? Вероятностная модель не нуждается в реальных данных? Спасибо.

29 probability mathematical-statistics

3

Интерпретация простых прогнозов отношения шансов в логистической регрессии

Я немного новичок в использовании логистической регрессии, и меня немного смущает расхождение между моими интерпретациями следующих значений, которые, по моему мнению, будут одинаковыми: возведенные в степень значения беты прогнозируемая вероятность результата с использованием бета-значений. Вот упрощенная версия модели, которую я использую, где недоедание и страхование являются двоичными, а богатство непрерывным: …

29 regression logistic interpretation prediction odds-ratio

3

Какая разница в том, что AIC и c-статистика (AUC) фактически измеряют для подгонки модели?

Информационный критерий Акаике (AIC) и c-статистика (площадь под кривой ROC) являются двумя показателями модели, пригодными для логистической регрессии. У меня возникают проблемы с объяснением того, что происходит, когда результаты двух измерений не совпадают. Я предполагаю, что они измеряют немного различные аспекты подгонки модели, но каковы эти конкретные аспекты? У меня …

29 logistic roc aic auc

1

СВД коррелированной матрицы должен быть аддитивным, но не

Я просто пытаюсь воспроизвести утверждение, сделанное в следующей статье « Поиск коррелированных бикластеров по данным экспрессии генов» : Предложение 4. Если . тогда мы имеем:XIJ=RICTJXIJ=RICJTX_{IJ}=R_{I}C^{T}_{J} я. Если - идеальный бикластер с аддитивной моделью, то - идеальный бикластер с корреляцией по столбцам; II. Если - идеальный бикластер с аддитивной моделью, то …

29 correlation multivariate-analysis svd

4

Простой способ алгоритмически идентифицировать всплеск зарегистрированных ошибок

Нам нужна система раннего предупреждения. Я имею дело с сервером, который, как известно, имеет проблемы с производительностью под нагрузкой. Ошибки записываются в базу данных вместе с отметкой времени. Есть некоторые шаги ручного вмешательства, которые могут быть предприняты, чтобы уменьшить нагрузку на сервер, но только если кто-то знает о проблеме ... …

29 time-series real-time

3

Чем распределение Пуассона отличается от нормального распределения?

Этот вопрос был перенесен из переполнения стека, потому что на него можно ответить по перекрестной проверке. Мигрировал 7 лет назад . Я сгенерировал вектор, который имеет распределение Пуассона, следующим образом: x = rpois(1000,10) Если я использую гистограмму hist(x), распределение выглядит как знакомое нормальное распределение в форме колокольчика. Однако в одном …

29 distributions histogram normal-distribution poisson-distribution

3

Какой тест я могу использовать для сравнения уклонов двух или более регрессионных моделей?

Я хотел бы проверить разницу в ответе двух переменных на один предиктор. Вот минимальный воспроизводимый пример. library(nlme) ## gls is used in the application; lm would suffice for this example m.set <- gls(Sepal.Length ~ Petal.Width, data = iris, subset = Species == "setosa") m.vir <- gls(Sepal.Length ~ Petal.Width, data = …

29 r data-visualization multivariate-analysis hypothesis-testing

2

Вычислить матрицу перехода (Маркова) в R

Есть ли способ в R (встроенная функция) вычислить матрицу переходов для цепи Маркова из набора наблюдений? Например, взять набор данных, подобный следующему, и вычислить матрицу перехода первого порядка? dat<-data.frame(replicate(20,sample(c("A", "B", "C","D"), size = 100, replace=TRUE)))

29 r markov-process

4

Пакеты R для выполнения тематического моделирования / LDA: просто `topicmodels` и` lda` [закрыто]

Закрыто. Этот вопрос не по теме . В настоящее время не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыто в прошлом году . Мне кажется, что только два пакета R способны выполнять скрытое выделение Дирихле : Один из них lda, автор Джонатан Чанг; …

29 r bayesian text-mining topic-models latent-dirichlet-alloc

3

Хорошие учебные пособия по гиббсу

Я хочу узнать, как работает выборка Гиббса, и я ищу хорошую базовую и промежуточную статью. У меня есть опыт работы в области компьютерных наук и базовые статистические знания. Кто-нибудь прочитал хороший материал вокруг? где ты это узнал? Благодарность

29 references gibbs

6

Интерпретация теста Шапиро-Вилка

Я довольно плохо знаком со статистикой, и мне нужна ваша помощь. У меня есть небольшой образец, как показано ниже: H4U 0.269 0.357 0.2 0.221 0.275 0.277 0.253 0.127 0.246 Я выполнил тест Шапиро-Уилка, используя R: shapiro.test(precisionH4U$H4U) и я получил следующий результат: W = 0.9502, p-value = 0.6921 Теперь, если я …

29 r distributions interpretation goodness-of-fit normality-assumption

2

Подгонка модели ARIMAX с регуляризацией или штрафом (например, с помощью лассо, эластичной сетки или регрессии гребня)

Я использую функцию auto.arima () в пакете прогноза для подбора моделей ARMAX с различными ковариатами. Тем не менее, у меня часто есть большое количество переменных для выбора, и обычно получается окончательная модель, которая работает с их подмножеством. Мне не нравятся специальные методы для выбора переменных, потому что я человек и …

29 r time-series lasso regularization elastic-net