Вопросы с тегом «count-data»

Данные подсчета представляют собой неотрицательные целые числа, представляющие целые суммы.

4
R / Stata пакет для отрицательно усеченного отрицательного бинома GEE?
Это мой первый пост. Я действительно благодарен за это сообщество. Я пытаюсь проанализировать данные продольного счета, которые укорочены до нуля (вероятность того, что переменная отклика = 0 равна 0), а среднее значение! = Дисперсия, поэтому для пуассона было выбрано отрицательное биномиальное распределение. Функции / команды, которые я исключил: р Функция …

1
Одинаковые коэффициенты, оцениваемые в модели Пуассона и Квази-Пуассона
При моделировании данных подсчета претензий в страховой среде я начал с Пуассона, но затем заметил чрезмерную дисперсию. Квази-Пуассон лучше моделировал большее отношение средней дисперсии, чем основной Пуассон, но я заметил, что коэффициенты были идентичны как в модели Пуассона, так и в модели Квази-Пуассона. Если это не ошибка, почему это происходит? …

1
Не можете найти подходящую модель для подсчета данных со смешанными эффектами - ZINB или что-то еще?
У меня есть очень маленький набор данных о численности одиночной пчелы, который мне трудно анализировать. Это данные подсчета, и почти все подсчеты находятся в одной обработке, а большинство нулей в другой обработке. Есть также пара очень высоких значений (по одному на двух из шести сайтов), поэтому распределение подсчетов имеет очень …

3
Прогнозирование данных счета со случайным лесом
Можно ли обучить Случайный Лес для правильного прогнозирования данных счета? Как это будет продолжаться? У меня довольно широкий диапазон значений, поэтому классификация не имеет смысла. Если бы я использовал регрессию, я бы просто усек результат? Я совершенно потерян здесь. Есть идеи?

3
Выбор альтернатив пуассоновской регрессии для данных о сверхдисперсных счетчиках
В настоящее время я анализирую данные из серии поведенческих экспериментов, которые все используют следующую меру. Участников этого эксперимента просят выбрать подсказки, которые (вымышленные) другие люди могли бы использовать, чтобы помочь решить серию из 10 анаграмм. Участники должны верить, что эти другие люди либо получат, либо потеряют деньги, в зависимости от …

2
Параметрическое моделирование дисперсии данных счета
Я хочу смоделировать некоторые данные, но я не уверен, какой тип модели я могу использовать. У меня есть данные подсчета, и я хочу модель, которая даст параметрические оценки как среднего значения, так и дисперсии данных. То есть у меня есть различные прогностические факторы, и я хочу определить, влияет ли какой-либо …


4
Какие преимущества имеет пуассоновская регрессия по сравнению с линейной регрессией в этом случае?
Мне дали набор данных, который содержит количество наград, заработанных учащимися в одной средней школе, где предикторами количества полученных наград являются тип программы, в которую был зачислен учащийся, и балл по их итоговому экзамену по математике. Мне было интересно, может ли кто-нибудь сказать мне, почему модель линейной регрессии может быть непригодной …

2
Допущения о пуассоновской регрессии и как их проверить в R
Я хотел бы проверить, какая регрессия лучше всего подходит для моих данных. Моя зависимая переменная - это число и имеет много нулей. И мне понадобится некоторая помощь, чтобы определить, какую модель и семейство использовать (пуассоновское или квазипуассонное или нулевая инфляция пуассоновых регрессий) и как проверить предположения. Регрессия Пуассона: насколько я …

3
Сравнение регрессионных моделей по данным подсчета
Недавно я подобрал 4 модели множественной регрессии для одного и того же предиктора / данных ответа. Две модели мне подходят с пуассоновской регрессией. model.pois <- glm(Response ~ P1 + P2 +...+ P5, family=poisson(), ...) model.pois.inter <- glm(Response ~ (P1 + P2 +...+ P5)^2, family=poisson(), ...) Две модели мне подходят с …

2
Кластеризация очень искаженных, подсчитываемых данных: есть ли какие-либо предложения (трансформировать и т.д.)
Основная проблема Вот моя основная проблема: я пытаюсь кластеризовать набор данных, содержащий некоторые очень искаженные переменные со счетчиками. Переменные содержат много нулей и поэтому не очень информативны для моей процедуры кластеризации, которая, вероятно, будет алгоритмом k-средних. Хорошо, вы говорите, просто преобразуйте переменные, используя квадратный корень, блок-кокс или логарифм. Но так …

3
Какую модель регрессии лучше всего использовать с данными подсчета?
Я пытаюсь немного заняться статистикой, но я застрял в чем-то. Мои данные следующие: Year Number_of_genes 1990 1 1991 1 1993 3 1995 4 Теперь я хочу построить регрессионную модель, чтобы на основе данных можно было прогнозировать количество генов за любой данный год. До сих пор я делал это с помощью …

2
Переменная масштаба как данные подсчета - правильно или нет?
В этой статье (свободно доступной через PubMed central) авторы используют отрицательную биномиальную регрессию для моделирования оценки на 10-элементном инструменте скрининга, набравшем 0-40. Эта процедура предполагает подсчет данных, что здесь явно не так. Мне бы хотелось узнать ваше мнение о том, является ли этот подход приемлемым, потому что я иногда использую …

2
Использовать ли смещение в регрессии Пуассона при прогнозировании общих карьерных целей, забитых хоккеистами
У меня вопрос по поводу того, стоит ли использовать смещение. Предположим, очень простая модель, где вы хотите описать (общее) количество голов в хоккее. Таким образом, у вас есть цели, количество сыгранных игр и фиктивная переменная «нападающий», которая равна 1, если игрок является нападающим, и 0 в противном случае. Итак, какая …

3
Данные подсчета моделирования, где переменная смещения равна 0 для некоторых наблюдений
Я пытаюсь помочь студенту коллеги. Студент наблюдал и подсчитывал поведение птицы (количество вызовов) в экспериментальной обстановке. Количество вызовов, относящихся к конкретной наблюдаемой птице во время каждого эксперимента, определить невозможно, но подсчет числа птиц, внесших вклад в количество зарегистрированных вызовов, был возможен. Следовательно, мое первоначальное предложение состояло в том, чтобы включить …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.