Вопросы с тегом «r»

Используйте этот тег для любого * по теме * вопроса, который (a) включает `R` либо в качестве критической части вопроса, либо в ожидаемом ответе, & (b) не * просто * о том, как использовать` R`.

1
LARS против координатного спуска для лассо
Каковы плюсы и минусы использования LARS [1] по сравнению с использованием координатного спуска для подбора L1-регуляризованной линейной регрессии? Я в основном заинтересован в аспектах производительности (мои проблемы, как правило, Nисчисляются сотнями тысяч и p<20). Однако, любые другие идеи также будут оценены. редактировать: так как я разместил вопрос, chl любезно указал …

1
Рассчитать стандартные ошибки Ньюи-Уэста без объекта lm в R
Я задал этот вопрос вчера на StackOverflow и получил ответ, но мы согласились, что он кажется немного хакерским и, возможно, есть лучший способ взглянуть на него. Вопрос: я хотел бы рассчитать стандартные ошибки Ньюи-Уэста (HAC) для вектора (в данном случае - вектора биржевых доходностей). Функция NeweyWest()в sandwichпакете делает это, но …

1
Могу ли я полуавтоматизировать диагностику сходимости MCMC для установки длины выгорания?
Я хотел бы автоматизировать выбор выгорания для цепочки MCMC, например, удалив первые n строк на основе диагностики сходимости. В какой степени этот шаг можно безопасно автоматизировать? Даже если я все еще дважды проверю автокорреляцию, трассировку mcmc и pdf, было бы неплохо автоматизировать выбор длины записи. Мой вопрос общий, но было …
13 r  bayesian  mcmc 

3
Простое объяснение графика параллельных координат
Я прочитал и видел много графиков параллельных координат. Может ли кто-нибудь ответить на следующие вопросы: Что такое параллельные координаты (PCP) в простых словах, чтобы непрофессионал мог понять? Математическое объяснение с некоторой интуицией, если это возможно Когда PCP полезен и когда их использовать? Когда это PCP не полезно , и когда …

3
Оцените размер популяции по количеству повторных наблюдений
Скажем, у меня 50 миллионов уникальных вещей, и я беру 10 миллионов образцов (с заменой) ... Первый прикрепленный график показывает, сколько раз я выбираю одну и ту же "вещь", что относительно редко население больше, чем моя выборка. Однако, если моя популяция составляет всего 10 миллионов штук, и я беру 10 …

3
Как смоделировать пользовательский анализ мощности модели lm (используя R)
Следуя недавним вопросам, которые у нас были здесь . Я прыгал, чтобы узнать, сталкивался ли кто-нибудь или может поделиться кодом R для выполнения пользовательского анализа мощности, основанного на моделировании для линейной модели? Позже я, очевидно, хотел бы расширить его на более сложные модели, но мне кажется, что мне стоит начать …

1
Формат ввода ответа в биномиальном glm в R
В России Rсуществует три метода форматирования входных данных для логистической регрессии с использованием glmфункции: Данные могут быть в «двоичном» формате для каждого наблюдения (например, y = 0 или 1 для каждого наблюдения); Данные могут быть в формате «Уилкинсон-Роджерс» (например, y = cbind(success, failure)), где каждая строка представляет одну обработку; или …

1
Почему в ecdf используется пошаговая функция, а не линейная интерполяция?
Эмпирические функции CDF обычно оцениваются пошаговой функцией. Есть ли причина, почему это делается таким образом, а не с помощью линейной интерполяции? Есть ли у функции шага какие-нибудь интересные теоретические свойства, которые заставляют нас предпочитать ее? Вот пример из двух: ecdf2 <- function (x) { x <- sort(x) n <- length(x) …
13 r  distributions  ecdf 

1
Пакет GBM против Карет с использованием GBM
Я занимался настройкой модели caret, но затем перезапустил модель, используя gbmпакет. Насколько я понимаю, caretпакет использует gbmи вывод должен быть одинаковым. Тем не менее, только быстрый запуск теста data(iris)показывает несоответствие в модели около 5% с использованием RMSE и R ^ 2 в качестве метрики оценки. Я хочу найти оптимальную производительность …

2
Формула для 95% доверительного интервала для
Я гуглил и искал по stats.stackexchange, но не могу найти формулу для расчета 95% доверительного интервала для значения для линейной регрессии. Кто-нибудь может это предоставить?р2R2R^2 Еще лучше, скажем, я выполнил линейную регрессию ниже в R. Как бы я вычислил 95% доверительный интервал для значения используя код R.р2R2R^2 lm_mtcars <- lm(mpg …

4
Интерпретация случайного отклонения эффекта в блеске
Я пересматриваю статью о опылении, где данные распределены биномиально (плод созревает или нет). Поэтому я использовал glmerодин случайный эффект (отдельное растение) и один фиксированный эффект (обработка). Рецензент хочет знать, повлияло ли растение на плодоношение, но у меня проблемы с интерпретацией glmerрезультатов. Я читал в Интернете, и, кажется, могут быть проблемы …

2
Какова интерпретация ковариации коэффициентов регрессии?
Функция lm в R может выводить оценочную ковариацию коэффициентов регрессии. Что эта информация дает нам? Можем ли мы теперь лучше интерпретировать модель или диагностировать проблемы, которые могут присутствовать в модели?

1
Извлечение откосов для случаев из модели смешанных эффектов (lme4)
Я хотел бы извлечь наклоны для каждого человека в модели смешанного эффекта, как обрисовано в общих чертах в следующем параграфе Модели смешанных эффектов использовались для характеристики отдельных путей изменения показателей когнитивной сводки, включая термины для возраста, пола и года обучения в качестве фиксированных эффектов (Laird and Ware, 1982; Wilson et …
13 r  mixed-model 

2
Расчет
Я читал о расчете значений в смешанных моделях и после прочтения FAQ по R-sig, других постов на этом форуме (я бы связал несколько, но мне не хватает репутации) и нескольких других ссылок, которые я понимаю, используя Значения в контексте смешанных моделей сложны.R 2р2R2R^2р2R2R^2 Однако недавно я наткнулся на эти две …

1
Интеграция эмпирического CDF
У меня есть эмпирическое распределение . Я рассчитываю это следующим образомG(x)G(x)G(x) x <- seq(0, 1000, 0.1) g <- ecdf(var1) G <- g(x) Я обозначаю , т. - это pdf, а - это cdf.h Gh(x)=dG/dxh(x)=dG/dxh(x) = dG/dxhhhGGG Теперь я хочу решить уравнение для верхнего предела интегрирования (скажем, ), чтобы ожидаемое значение …
13 r  integral  ecdf 

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.