Вопросы с тегом «r»

Используйте этот тег для любого * по теме * вопроса, который (a) включает `R` либо в качестве критической части вопроса, либо в ожидаемом ответе, & (b) не * просто * о том, как использовать` R`.

2
Как интерпретировать параметры в GLM с семейством = гамма
Этот вопрос был перенесен из переполнения стека, потому что на него можно ответить по перекрестной проверке. Мигрировал 5 лет назад . У меня есть вопрос, касающийся интерпретации параметров для GLM с гамма-распределенной зависимой переменной. Вот что R возвращает для моего GLM с лог-ссылкой: Call: glm(formula = income ~ height + …

2
Как применить биномиальный GLMM (glmer) к процентам, а не к счетам да-нет?
У меня есть эксперимент с повторными измерениями, где зависимая переменная представляет собой процент, и у меня есть несколько факторов в качестве независимых переменных. Я хотел бы использовать glmerиз пакета R, lme4чтобы рассматривать его как проблему логистической регрессии (путем указания family=binomial), так как он, кажется, приспосабливает эту настройку напрямую. Мои данные …

5
Случайный лес против регрессии
Я запустил модель регрессии МНК на наборе данных с 5 независимыми переменными. Независимые переменные и зависимые переменные являются непрерывными и линейно связаны. Площадь R составляет около 99,3%. Но когда я запускаю то же самое, используя случайный лес в R, мой результат выглядит так: «% Var объяснено: 88.42». Почему случайный лесной …

5
Как контролировать стоимость ошибочной классификации в случайных лесах?
Можно ли контролировать стоимость ошибочной классификации в пакете R randomForest ? В моей собственной работе ложные отрицания (например, отсутствие по ошибке того, что у человека может быть заболевание) намного дороже ложных срабатываний. Пакет rpart позволяет пользователю контролировать затраты на неправильную классификацию, указывая матрицу потерь для неправильной классификации веса по-разному. Существует …

5
Источники для изучения (не только бега) статистики / математики через R
Мне интересны примеры источников (R-код, R-пакеты, книги, главы книг, статьи, ссылки и т. Д.) Для изучения статистических и математических понятий через R (это также может быть и через другие языки, но R - мой любимый вариант). Проблема в том, что изучение материала основано на программировании, а не только на том, …

1
Остаточная диагностика в регрессионных моделях на основе MCMC
Недавно я приступил к подгонке регрессионно-смешанных моделей в байесовской структуре, используя алгоритм MCMC (функция MCMCglmm в R на самом деле). Я полагаю, что я понял, как диагностировать сходимость процесса оценки (след, график Гьюке, автокорреляция, апостериорное распределение ...). Одна из вещей, которая поражает меня в байесовской структуре, - это то, что …

4
Важность предикторов в множественной регрессии: частичное против стандартизированных коэффициентов
Мне интересно, какова точная связь между частичным и коэффициентами в линейной модели и должен ли я использовать только один или оба, чтобы проиллюстрировать важность и влияние факторов.R2R2R^2 Насколько я знаю, с помощью summaryя получаю оценки коэффициентов, а с anovaсуммой квадратов для каждого фактора - доля суммы квадратов одного фактора, деленная …

3
Укладка / сборка моделей с кареткой
Я часто нахожу себя обучающим несколько различных прогностических моделей с использованием caretR. Я тренирую их все по одним и тем же сгибам перекрестной проверки, используя caret::: createFolds, а затем выбираю лучшую модель, основанную на перекрестно проверенной ошибке. Тем не менее, медианный прогноз из нескольких моделей часто превосходит лучшую единственную модель …
21 r  caret  ensemble 

1
Как я могу выровнять / синхронизировать два сигнала?
Я провожу некоторые исследования, но застрял на этапе анализа (следовало бы уделять больше внимания моим статистическим лекциям). Я собрал два одновременных сигнала: скорость потока, интегрированная для объема, и изменение объема груди. Я хотел бы сравнить сигналы и в конечном итоге надеяться получить объем из сигнала расширения груди. Но сначала я …

3
Первый шаг для больших данных ( , )
Предположим, вы анализируете огромный набор данных из миллиардов наблюдений в день, где каждое наблюдение имеет несколько тысяч разреженных и, возможно, избыточных числовых и категориальных переменных. Скажем, есть одна проблема регрессии, одна проблема неуравновешенной двоичной классификации и одна задача «выяснить, какие предикторы являются наиболее важными». Моя мысль о том, как подойти …

3
Расхождение с регрессом ANOVA (aov против lm в R)
У меня всегда было впечатление, что регрессия - это просто более общая форма ANOVA и результаты будут идентичны. Однако недавно я провел и регрессию, и ANOVA для одних и тех же данных, и результаты значительно различаются. То есть в регрессионной модели значимы как основные эффекты, так и взаимодействие, в то …
21 r  regression  anova 

1
Как я могу предсказать значения из новых входных данных линейной модели в R?
Locked . Этот вопрос и его ответы заблокированы, потому что вопрос не по теме, но имеет историческое значение. В настоящее время он не принимает новые ответы или взаимодействия. Я создал линейную модель в R: mod = lm(train_y ~ train_x). Я хочу передать ему список X и получить его предсказанный / …

1
Эффективный расчет обратной матрицы в R
Мне нужно рассчитать обратную матрицу и использовать solveфункцию. Хотя он хорошо работает на маленьких матрицах, он solveимеет тенденцию быть очень медленным на больших матрицах. Мне было интересно, есть ли какая-либо другая функция или комбинация функций (через SVD, QR, LU или другие функции разложения), которые могут дать мне более быстрые результаты.

5
Пример сильного коэффициента корреляции с высоким значением p
Мне было интересно, возможно ли иметь очень сильный коэффициент корреляции (скажем, 0,9 или выше), с высоким значением р (скажем, 0,25 или выше)? Вот пример низкого коэффициента корреляции с высоким значением p: set.seed(10) y <- rnorm(100) x <- rnorm(100)+.1*y cor.test(x,y) кор = 0,03908927, р = 0,6994 Высокий коэффициент корреляции, низкое значение …

3
Авто.арима с ежедневными данными: как уловить сезонность / периодичность?
Я устанавливаю модель ARIMA на ежедневные временные ряды. Данные собираются ежедневно с 02-01-2010 по 30-07-2011 и касаются продаж газет. Поскольку можно найти недельный график продаж (среднесуточное количество проданных копий обычно одинаково с понедельника по пятницу, а затем увеличивается в субботу и воскресенье), я пытаюсь уловить эту «сезонность». Учитывая данные о …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.