Вопросы с тегом «generalized-linear-model»

Обобщение линейной регрессии, учитывающее нелинейные отношения с помощью «функции связи» и дисперсии отклика, зависящей от прогнозируемого значения. (Не путать с «общей линейной моделью», которая расширяет обычную линейную модель до общей ковариационной структуры и многомерного отклика.)

1
Когда использовать данные Пуассона против геометрических и отрицательных биномиальных GLM для данных подсчета?
Я пытаюсь сделать макет для себя, когда уместно использовать тип регрессии (геометрический, пуассоновский, отрицательный бином) с данными счета в рамках GLM (только 3 из 8 распределений GLM используются для данных счета, хотя большая часть того, что Я читал центры вокруг отрицательных биномиальных и пуассоновских распределений). Когда использовать данные Пуассона против …

2
Как интерпретировать параметры в GLM с семейством = гамма
Этот вопрос был перенесен из переполнения стека, потому что на него можно ответить по перекрестной проверке. Мигрировал 5 лет назад . У меня есть вопрос, касающийся интерпретации параметров для GLM с гамма-распределенной зависимой переменной. Вот что R возвращает для моего GLM с лог-ссылкой: Call: glm(formula = income ~ height + …

3
Регрессия Пуассона против регрессии по методу наименьших квадратов?
Пуассоновская регрессия - это GLM с функцией log-link. Альтернативный способ моделирования данных с ненормально распределенным счетчиком - это предварительная обработка путем взятия журнала (или, скорее, журнала (1 + счет) для обработки 0). Если вы выполняете регрессию методом наименьших квадратов в ответах на количество журналов, связано ли это с регрессией Пуассона? …

1
Почему квазипуассон в GLM не рассматривается как частный случай отрицательного бинома?
Я пытаюсь приспособить обобщенные линейные модели к некоторым наборам данных подсчета, которые могут быть или не быть перераспределены. Здесь применимы два канонических распределения: Пуассон и Отрицательный бином (Негбин) с EV и дисперсией.μμ\mu Вгп= μВaрпзнак равноμVar_P = \mu ВгNВ= μ + μ2θВaрNВзнак равноμ+μ2θVar_{NB} = \mu + \frac{\mu^2}{\theta} которые могут быть установлены …

3
Как рассчитать качество посадки в glm (R)
У меня есть следующий результат от запуска функции GLM. Как я могу интерпретировать следующие значения: Нулевое отклонение Остаточное отклонение AIC Они имеют какое-то отношение к совершенству? Могу ли я рассчитать некоторую степень достоверности соответствия по этим результатам, таким как R-квадрат или любая другая мера? Call: glm(formula = tmpData$Y ~ tmpData$X1 …

1
От байесовских сетей к нейронным сетям: как многомерная регрессия может быть перенесена в сеть с несколькими выходами
Я имею дело с байесовской иерархической линейной моделью , здесь описывается сеть. представляет ежедневные продажи продукта в супермаркете (наблюдается).YYY - известная матрица регрессоров, включая цены, акции, день недели, погоду, праздники.XXX - неизвестный уровень скрытого запаса каждого продукта, который вызывает большинство проблем и который я считаю вектором двоичных переменных, по одному …

1
Есть ли какое-либо интуитивное объяснение того, почему логистическая регрессия не будет работать в случае идеального разделения? И почему добавление регуляризации это исправит?
У нас много хороших дискуссий по поводу идеального разделения в логистической регрессии. Например, логистическая регрессия в R привела к идеальному разделению (феномен Хаука-Доннера). Что теперь? и модель логистической регрессии не сходится . Лично я все еще чувствую, что это не интуитивно понятно, почему это будет проблемой и почему добавление регуляризации …

4
Работа с 0,1 значениями в бета-регрессии
У меня есть некоторые данные в [0,1], которые я хотел бы проанализировать с помощью бета-регрессии. Конечно, что-то нужно сделать, чтобы приспособить значения 0,1. Мне не нравится изменять данные, чтобы соответствовать модели. Кроме того, я не верю, что нулевая и 1 инфляция - это хорошая идея, потому что я считаю, что …

2
Преобразование данных пропорции: когда квадратного корня арксинуса недостаточно
Есть ли (более сильная?) Альтернатива квадратному корню арксин для преобразования процент / пропорция? В наборе данных, над которым я сейчас работаю, заметная гетероскедастичность сохраняется после того, как я применяю это преобразование, то есть график зависимости остатков от подгоночных значений все еще очень ромбовидный. Отредактировано, чтобы отвечать на комментарии: данные представляют …

3
Как интерпретировать термин перехват в GLM?
Я использую R и анализирую свои данные с помощью GLM с биноминальной ссылкой. Я хочу знать, что означает перехват в выходной таблице. Перехват для одной из моих моделей существенно отличается, однако переменная - нет. Что это значит? Что такое перехват? Я не знаю, просто ли я запутываю себя, но, обыскав …

1
Как обрабатываются значения NA в glm в R
У меня есть таблица данных T1, которая содержит почти тысячу переменных (V1) и около 200 миллионов точек данных. Данные редки, и большинство записей - NA. Каждый пункт данных имеет уникальный идентификатор и пару дат, чтобы отличить его от другого. У меня есть другая таблица T2, которая содержит отдельный набор переменных …

2
Какая диагностика может подтвердить использование определенного семейства GLM?
Это кажется таким элементарным, но я всегда застреваю на этом этапе ... Большинство данных, с которыми я имею дело, являются ненормальными, и большинство анализов основано на структуре GLM. Для моего текущего анализа у меня есть переменная ответа, которая является "скоростью ходьбы" (метры в минуту). Мне легко определить, что я не …

4
Лучший способ справиться с гетероскедастичностью?
У меня есть график остаточных значений линейной модели в зависимости от подогнанных значений, где гетероскедастичность очень ясна. Однако я не уверен, как мне поступить сейчас, потому что, насколько я понимаю, эта гетероскедастичность делает мою линейную модель недействительной. (Это правильно?) Используйте надежную линейную аппроксимацию, используя rlm()функцию MASSпакета, потому что он явно …

1
Хорошая посадка и какую модель выбрать линейную регрессию или Пуассона
Мне нужны некоторые советы относительно двух основных дилемм в моем исследовании, которое представляет собой исследование трех крупных фармацевтических препаратов и инноваций. Количество патентов в год является зависимой переменной. Мои вопросы Каковы наиболее важные критерии для хорошей модели? Что более / менее важно? Это то, что большинство или все переменные будут …

1
Почему использование метода Ньютона для оптимизации логистической регрессии называется итеративным пересчитанным методом наименьших квадратов?
Почему использование метода Ньютона для оптимизации логистической регрессии называется итеративным пересчитанным методом наименьших квадратов? Это кажется мне неясным, потому что логистическая потеря и потеря наименьших квадратов - совершенно разные вещи.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.