Вопросы с тегом «r»

Используйте этот тег для любого * по теме * вопроса, который (a) включает `R` либо в качестве критической части вопроса, либо в ожидаемом ответе, & (b) не * просто * о том, как использовать` R`.


2
Как это возможно, что Пуассон GLM принимает нецелые числа?
Я действительно ошеломлен тем фактом, что Poisson GLM принимает нецелые числа! Посмотрите: Данные (содержание data.txt): 1 2001 0.25 1 1 2002 0.5 1 1 2003 1 1 2 2001 0.25 1 2 2002 0.5 1 2 2003 1 1 R скрипт: t <- read.table("data.txt") names(t) <- c('site', 'year', 'count', 'weight') …

3
Т-распределение Фиттинга в R: параметр масштабирования
Как мне подобрать параметры t-распределения, то есть параметры, соответствующие «среднему» и «стандартному отклонению» нормального распределения. Я предполагаю, что они называются «среднее» и «масштабирование / степени свободы» для t-распределения? Следующий код часто приводит к ошибкам «сбой оптимизации». library(MASS) fitdistr(x, "t") Нужно ли сначала масштабировать х или преобразовать в вероятности? Как лучше …

5
Как указать логнормальное распределение в аргументе семейства glm в R?
Простой вопрос: как указать логнормальное распределение в аргументе семейства GLM в R? Я не мог найти, как это может быть достигнуто. Почему логнормальный (или экспоненциальный) не вариант в семейном аргументе? Где-то в R-архивах я читал, что нужно просто использовать лог-ссылку для семейства, установленного на гауссовский в GLM, чтобы указать логнормальное. …

3
Фиттинг многомерный, натуральный кубический сплайн
примечание: без правильных ответов через месяц я разместил сообщение на SO Фон У меня есть модель, fff , где Y=f(X)Y=f(X)Y=f(\textbf{X}) XX\textbf{X} -матрица выборок изпараметров размером а-векторвыходных данных модели.n×mn×mn \times mmmmYYYn×1n×1n \times 1 fff требует большого объема вычислений, поэтому я хотел бы аппроксимировать fff используя многовариантный кубический сплайн через (X,Y)(X,Y)(X,Y) точек, …

2
Вычисление 95-го процентиля: сравнение нормального распределения, подходов R-квантиль и Excel
Я пытался вычислить 95-й процентиль для следующего набора данных. Я наткнулся на несколько онлайн-ссылок на это. Подход 1: на основе выборочных данных Первый один говорит мне , для получения TOP 95 Percentнабора данных , а затем выберите MINили AVGиз результирующего набора. Это дает мне следующий набор данных: AVG: 29162 MIN: …
17 r  dataset  quantiles  sql 

5
Для классификации со случайными лесами в R, как следует приспособиться к несбалансированным размерам классов?
Я изучаю различные методы классификации для проекта, над которым я работаю, и заинтересован в попытках использовать «Случайные леса». Я стараюсь обучаться сам по себе, и буду признателен за любую помощь, предоставленную сообществом CV. Я разделил свои данные на тренировочные / тестовые наборы. После экспериментов со случайными лесами в R (с …

1
Использование HMM в количественных финансах. Примеры HMM, который работает, чтобы обнаружить трендовые / поворотные точки?
Я открываю для себя удивительный мир таких «скрытых марковских моделей», которые также называют «моделями переключения режимов». Я хотел бы адаптировать HMM в R для обнаружения трендов и поворотных моментов. Я хотел бы построить модель как можно более общей, чтобы я мог протестировать ее по многим ценам. Кто-нибудь может порекомендовать бумагу? …

2
Что такое «коэффициенты линейных дискриминантов» в LDA?
В R, я использую ldaфункцию из библиотеки, MASSчтобы сделать классификацию. Как я понимаю LDA, входу будет присвоен ярлык , что максимизирует , верно?ИксИксxYYyр ( у| х)п(Y|Икс)p(y|x) Но когда я к модели, в которой я не совсем понимаю вывод , х = ( Л а г1 , L a g2 )Иксзнак …

2
Имеет ли смысл использовать переменную даты в регрессии?
Я не привык использовать переменные в формате даты в R. Мне просто интересно, можно ли добавить переменную даты в качестве объясняющей переменной в модели линейной регрессии. Если это возможно, как мы можем интерпретировать коэффициент? Это влияние одного дня на итоговую переменную? Посмотрите мою суть с примером того, что я пытаюсь …

2
Понимание теста Колмогорова-Смирнова в R
Я пытаюсь понять вывод тестовой функции Колмогорова-Смирнова (два примера, двухсторонние). Вот простой тест. x <- c(1,2,2,3,3,3,3,4,5,6) y <- c(2,3,4,5,5,6,6,6,6,7) z <- c(12,13,14,15,15,16,16,16,16,17) ks.test(x,y) # Two-sample Kolmogorov-Smirnov test # #data: x and y #D = 0.5, p-value = 0.1641 #alternative hypothesis: two-sided # #Warning message: #In ks.test(x, y) : cannot compute …

1
Как найти / оценить функцию плотности вероятности по функции плотности в R
Предположим, что у меня есть переменная, как Xс неизвестным распределением. В Mathematica, используя SmoothKernelDensityфункцию, мы можем получить оценочную функцию плотности. Эту оценочную функцию плотности можно использовать вместе с PDFфункцией для вычисления функции плотности вероятности значения, например, Xв PDF[density,X]предположении, что «плотность» является результатом SmoothKernelDensity. Было бы хорошо, если бы такая функция …
17 r  pdf  cdf 

2
Как бороться с ошибкой, такой как «Коэффициенты: 14 не определены из-за особенностей» в R?
При выполнении GLM, и вы получаете ошибку «не определено из-за особенностей» в выводе anova, как можно предотвратить возникновение этой ошибки? Некоторые полагают, что это происходит из-за коллинеарности между ковариатами или что один из уровней отсутствует в наборе данных (см .: интерпретация «не определено из-за особенностей» в lm ) Если бы …

2
Что здесь происходит, когда я использую квадрат потерь в настройке логистической регрессии?
Я пытаюсь использовать квадратичные потери, чтобы выполнить двоичную классификацию для набора данных игрушек. Я использую mtcarsнабор данных, использую милю на галлон и вес, чтобы предсказать тип передачи. На приведенном ниже графике показаны два типа данных типа передачи в разных цветах и ​​границы решения, сформированные различными функциями потерь. Квадратный убыток равен …

1
Происхождение обозначений в стиле Уилкинсона, таких как (1 | id) для случайных эффектов в формулах смешанных моделей в R
Модельные формулы в R, такие как y ~ x + a*b + c:d основаны на так называемой записи Уилкинсона : Уилкинсон и Роджерс 1973, Символическое описание факторных моделей для анализа отклонений . В этой статье не обсуждались нотации для смешанных моделей (которых тогда не могло быть). Так, где же смешанные …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.