Вопросы с тегом «count-data»

Данные подсчета представляют собой неотрицательные целые числа, представляющие целые суммы.

1
Почему преобразование квадратного корня рекомендуется для данных подсчета?
Часто рекомендуется брать квадратный корень, когда у вас есть данные подсчета. (Некоторые примеры CV можно найти в ответе @ HarveyMotulsky здесь или в ответе @ whuber здесь .) С другой стороны, при подборе обобщенной линейной модели с переменной отклика, распределенной как Пуассон, журнал является канонической ссылкой . Это похоже на …

5
Почему для подсчета используется регрессия Пуассона?
Я понимаю, что для определенных наборов данных, таких как голосование, он работает лучше. Почему регрессия Пуассона используется поверх обычной линейной регрессии или логистической регрессии? Какова математическая мотивация для этого?

1
Метрики ошибок для перекрестной проверки моделей Пуассона
Я перекрестно проверяю модель, которая пытается предсказать счет. Если бы это была проблема бинарной классификации, я бы вычислял AUC вне складывания, а если бы это была проблема регрессии, я бы вычислял среднеквадратичное среднеквадратичное значение или MAE. Для модели Пуассона какие метрики ошибок я могу использовать для оценки «точности» прогнозов вне …

3
Является ли «модель препятствий» действительно одной моделью? Или только две отдельные, последовательные модели?
Рассмотрим модель препятствий, прогнозирующую данные подсчета yот обычного предиктора x: set.seed(1839) # simulate poisson with many zeros x <- rnorm(100) e <- rnorm(100) y <- rpois(100, exp(-1.5 + x + e)) # how many zeroes? table(y == 0) FALSE TRUE 31 69 В этом случае у меня есть данные счета …

2
Диагностика для обобщенных линейных (смешанных) моделей (особенно остатков)
В настоящее время я пытаюсь найти подходящую модель для сложных данных подсчета (зависимая переменная). Я пробовал различные модели (модели смешанных эффектов необходимы для моего вида данных), такие как lmerи lme4(с лог-преобразованием), а также обобщенные линейные модели смешанных эффектов с различными семействами, такими как гауссовский или отрицательный бином. Тем не менее, …

2
Непрерывное обобщение отрицательного биномиального распределения
Отрицательное биномиальное (NB) распределение определяется на неотрицательных целых числах и имеет функцию вероятности массыИмеет ли смысл рассматривать непрерывное распределение на неотрицательных вещественных числах, определенных той же формулой (заменив k \ in \ mathbb N_0 на x \ in \ mathbb R _ {\ ge 0} )? Биномиальный коэффициент может быть …

4
Является ли этот метод подходящим для проверки сезонных эффектов в данных о количестве самоубийств?
У меня есть 17 лет (с 1995 по 2011) данных свидетельств о смерти, связанных со смертями от самоубийств для штата в США. Существует много мифологий о самоубийствах и месяцах / сезонах, большая часть которых противоречива, и литературы, которую я ' После проверки я не получил четкого представления о применяемых методах …

9
Временные ряды для данных счета, с количеством <20
Недавно я начал работать в туберкулезной клинике. Мы периодически встречаемся, чтобы обсудить количество случаев туберкулеза, которые мы сейчас лечим, количество проведенных тестов и т. Д. Я хотел бы начать моделировать эти показатели, чтобы мы не просто угадали, является ли что-то необычным или нет. К сожалению, у меня было очень мало …

1
Когда использовать данные Пуассона против геометрических и отрицательных биномиальных GLM для данных подсчета?
Я пытаюсь сделать макет для себя, когда уместно использовать тип регрессии (геометрический, пуассоновский, отрицательный бином) с данными счета в рамках GLM (только 3 из 8 распределений GLM используются для данных счета, хотя большая часть того, что Я читал центры вокруг отрицательных биномиальных и пуассоновских распределений). Когда использовать данные Пуассона против …

1
Обнаружение выбросов в данных подсчета
У меня есть то, что я наивно думал, что это довольно прямая проблема, которая включает в себя обнаружение выбросов для множества различных наборов данных подсчета. В частности, я хочу определить, является ли одно или несколько значений в серии данных подсчета выше или ниже ожидаемого по сравнению с остальными подсчетами в …

3
Ноль-завышенная отрицательная биномиальная модель смешанных эффектов в R
Существует ли такой пакет, который обеспечивает нулевую раздувание отрицательной биномиальной оценки модели смешанных эффектов в R? Под этим я подразумеваю: Нулевая инфляция, где вы можете указать биномиальную модель для нулевой инфляции, как в функции zeroinfl в пакете pscl: zeroinfl (y ~ X | Z, dist = "negbin") где Z - …

2
Пуассон или квази пуассон в регрессии с данными подсчета и избыточной дисперсией?
У меня есть данные подсчета (анализ спроса / предложения с подсчетом количества клиентов, в зависимости от - возможно - многих факторов). Я пробовал линейную регрессию с нормальными ошибками, но мой QQ-график не очень хорош. Я попробовал лог-преобразование ответа: еще раз плохой QQ-сюжет. Итак, сейчас я пытаюсь регрессии с пуассоновскими ошибками. …

1
Значимость различия между двумя пунктами
Есть ли способ определить, отличается ли разница между количеством дорожно-транспортных происшествий в момент времени 1 от количества в момент времени 2? Я нашел разные методы для определения различий между группами наблюдений в разное время (например, сравнение средних Пуассона), но не для сравнения только двух отсчетов. Или это даже неверно пытаться? …

2
Нарушает ли использование данных подсчета в качестве независимой переменной какое-либо из предположений GLM?
Я хотел бы использовать данные подсчета в качестве ковариат при подборе модели логистической регрессии. Мой вопрос: Нарушаю ли я какое-либо предположение о логистической (и, в целом, об обобщенной линейной) модели, используя в качестве независимых переменных неотрицательные целочисленные переменные? Я нашел много ссылок в литературе относительно использования данных подсчета в качестве …

2
Стандартная ошибка подсчета
У меня есть набор данных об инцидентах по сезонам редких заболеваний. Например, скажем, было 180 случаев весной, 90 летом, 45 осенью и 210 зимой. Я борюсь с тем, уместно ли прикреплять стандартные ошибки к этим числам. Цели исследования являются выводными в том смысле, что мы ищем сезонную картину заболеваемости, которая …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.