Вопросы с тегом «r»

Используйте этот тег для любого * по теме * вопроса, который (a) включает `R` либо в качестве критической части вопроса, либо в ожидаемом ответе, & (b) не * просто * о том, как использовать` R`.

1
Интерпретация выходных данных .L & .Q из отрицательного биномиального GLM с категориальными данными
Я только что запустил отрицательный биномиальный GLM, и это вывод: Call: glm.nb(formula = small ~ method + site + depth, data = size.dat, init.theta = 1.080668549, link = log) Deviance Residuals: Min 1Q Median 3Q Max -2.2452 -0.9973 -0.3028 0.3864 1.8727 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 1.6954 …


2
Могу ли я использовать CLR (центрированное преобразование логарифмического отношения) для подготовки данных для PCA?
Я использую скрипт. Это для основных записей. У меня есть датафрейм, который показывает различные элементные композиции в столбцах на заданной глубине (в первом столбце). Я хочу провести с ним PCA, и меня не устраивает метод стандартизации, который я должен выбрать. Кто-нибудь из вас использовал clr()данные для подготовки prcomp()? Или это …

1
Эквивалентность (0 + фактор | группа) и (1 | группа) + (1 | группа: фактор) характеристики случайных эффектов в случае составной симметрии
Дуглас Бейтс утверждает, что следующие модели эквивалентны «если матрица дисперсии-ковариации для векторно-значных случайных эффектов имеет особую форму, называемую составной симметрией» ( слайд 91 в этой презентации ): m1 <- lmer(y ~ factor + (0 + factor|group), data) m2 <- lmer(y ~ factor + (1|group) + (1|group:factor), data) В частности, Бейтс …

2
Что r, r в квадрате и остаточное стандартное отклонение говорят нам о линейных отношениях?
Немного предыстории Я работаю над интерпретацией регрессионного анализа, но я действительно запутался в значении r, r в квадрате и остаточного стандартного отклонения. Я знаю определения: характеризации r измеряет силу и направление линейной зависимости между двумя переменными на диаграмме рассеяния R-квадрат - это статистическая мера того, насколько близки данные к подогнанной …

1
В чем разница между логистической регрессией и регрессией дробного ответа?
Насколько я знаю, разница между логистической моделью и моделью дробного отклика (frm) заключается в том, что зависимая переменная (Y), в которой frm равна [0,1], но логистика - {0, 1}. Кроме того, frm использует оценку квази-правдоподобия для определения своих параметров. Обычно мы можем использовать glmдля получения логистических моделей glm(y ~ x1+x2, …

1
Объясните, как `eigen` помогает инвертировать матрицу
Мой вопрос относится к вычислительной технике, используемой в geoR:::.negloglik.GRFили geoR:::solve.geoR. В линейной смешанной модели: Y=Xβ+Zb+eY=Xβ+Zb+e Y=X\beta+Zb+e где ββ\beta и bbb - фиксированные и случайные эффекты соответственно. Также Σ=cov(Y)Σ=cov(Y)\Sigma=\text{cov}(Y) При оценке последствий, необходимо , чтобы вычислить , которые обычно можно сделать , используя что - то вроде , но иногда ( …

2
Процедура и методы анализа временных рядов с использованием R
Я работаю над небольшим проектом, в котором мы пытаемся прогнозировать цены на товары (нефть, алюминий, олово и т. Д.) На ближайшие 6 месяцев. У меня есть 12 таких переменных для прогнозирования, и у меня есть данные за апрель 2008 года - май 2013 года. Как я должен идти о предсказании? …

1
R: проверить нормальность остатков линейной модели - какие остатки использовать
Я хотел бы сделать W-тест Шапиро Уилка и тест Колмогорова-Смирнова на невязках линейной модели, чтобы проверить на нормальность. Мне было просто интересно, какие остатки следует использовать для этого - необработанные остатки, остатки Пирсона, студентизированные остатки или стандартизированные остатки? Для теста W Шапиро-Уилка кажется, что результаты для неочищенных и остатков Пирсона …

1
Неверный вывод, когда наблюдения не являются независимыми
Из элементарной статистики я узнал, что с общей линейной моделью, чтобы выводы были достоверными, наблюдения должны быть независимыми. Когда происходит кластеризация, независимость может больше не сохраняться, приводя к неверному выводу, если это не учитывается. Одним из способов учета такой кластеризации является использование смешанных моделей. Я хотел бы найти примерный набор …

2
С помощью пакета каретки можно ли получить матрицы путаницы для конкретных пороговых значений?
Я получил модель логистической регрессии (через train) для бинарного ответа, и я получил логистическую матрицу спутанности через confusionMatrixв caret. Это дает мне путаницу в логистической модели, хотя я не уверен, какой порог используется для ее получения. Как получить матрицу путаницы для определенных пороговых значений, используя confusionMatrixin caret?

1
Как проверить, следует ли распределение степенному закону?
У меня есть данные о том, сколько пользователей публикуют сколько вопросов. Например, [UserCount, QuestionCount] [2, 100] [9, 10] [3, 80] ... ... Это означает, что 2 пользователя разместили по 100 вопросов, 9 пользователей - по 10 вопросов и т. Д. Итак, как я могу определить, UserCount, QuestionCountследует ли распределение степенному …

2
Есть ли причина не использовать ортогональные многочлены при подборе регрессий?
В общем, мне интересно, если там когда-либо лучше не использовать ортогональные полиномы при подборе регрессии с переменными более высокого порядка. В частности, мне интересно с использованием R: Если poly()с raw = FALSEпроизводит то же значение, что и подогнанного poly()с raw = TRUE, и polyс raw = FALSEрешаете некоторые из проблем …

1
Почему R's lm () возвращает оценки коэффициентов, отличные от моего учебника?
Фон Я пытаюсь понять первый пример в курсе по подгонке моделей (так что это может показаться до смешного простым). Я сделал вычисления вручную, и они соответствуют примеру, но когда я повторяю их в R, коэффициенты модели отключены. Я думал, что разница может быть связана с тем, что в учебнике используется …
13 r  regression  self-study  lm 

2
используя информацию о соседях при вменении данных или находке вне данных (в R)
У меня есть набор данных с предположением, что ближайшие соседи являются лучшими предикторами. Просто прекрасный пример визуализации двухстороннего градиента Предположим, у нас есть случай, когда несколько значений отсутствуют, мы можем легко предсказать на основе соседей и тренда. Соответствующая матрица данных в R (фиктивный пример для тренировки): miss.mat <- matrix (c(5:11, …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.