Вопросы с тегом «modeling»

Этот тег описывает процесс создания статистической или машинной модели обучения. Всегда добавляйте более конкретный тег.

2
Распределение, которое описывает разницу между отрицательными биномиальными распределенными переменными?
Skellam Распределение описывает разницу между двумя переменными , которые имеют распределение Пуассона. Существует ли подобное распределение, которое описывает разницу между переменными, которые следуют отрицательным биномиальным распределениям? Мои данные получены с помощью процесса Пуассона, но содержат значительное количество шума, что приводит к чрезмерному рассредоточению в распределении. Таким образом, моделирование данных с …

1
Свойства логистических регрессий
Мы работаем с некоторыми логистическими регрессиями, и мы поняли, что средняя оценочная вероятность всегда равна доле вероятностей в выборке; то есть среднее значение подгонянных значений равно среднему значению по выборке. Кто-нибудь может объяснить мне причину или дать ссылку, где я могу найти эту демонстрацию?

5
Пуассоновская регрессия с большими данными: неправильно ли менять единицу измерения?
Из-за факториала в распределении Пуассона становится непрактичным оценивать модели Пуассона (например, с использованием максимальной вероятности), когда наблюдения велики. Так, например, если я пытаюсь оценить модель для объяснения количества самоубийств в конкретном году (доступны только годовые данные) и скажу, что каждый год совершаются тысячи самоубийств, неправильно ли выражать самоубийства сотнями , …

3
Какова связь между R-квадратом и р-значением в регрессии?
tl; dr - для регрессии OLS, более высокий R-квадрат также подразумевает более высокое P-значение? В частности, для одной объясняющей переменной (Y = a + bX + e), но было бы также интересно узнать для n нескольких объясняющих переменных (Y = a + b1X + ... bnX + e). Контекст - …

7
Почему искаженные данные не предпочтительны для моделирования?
В большинстве случаев, когда люди говорят о преобразованиях переменных (как для предикторов, так и для переменных ответа), они обсуждают способы обработки асимметрии данных (например, преобразование журнала, преобразование Бокса и Кокса и т. Д.). Я не могу понять, почему устранение асимметрии считается такой распространенной передовой практикой? Как асимметрия влияет на производительность …

1
Подходящие модели в R, где коэффициенты подчиняются линейным ограничениям
Как определить формульную формулу в R, когда доступно одно (или несколько) точных линейных ограничений, связывающих коэффициенты. В качестве примера, скажем, что вы знаете, что b1 = 2 * b0 в простой модели линейной регрессии. Спасибо!
16 r  regression  modeling 

2
Какое распределение использовать для моделирования времени до прибытия поезда?
Я пытаюсь смоделировать некоторые данные о времени прибытия поезда. Я хотел бы использовать дистрибутив, который фиксирует «чем дольше я жду, тем больше вероятность того, что поезд появится» . Похоже, что такой дистрибутив должен выглядеть как CDF, так что P (Train Train Up | Ожидал 60 минут) близко к 1. Какой …

7
Какая кривая (или модель) должна соответствовать моим процентным данным?
Я пытаюсь создать фигуру, которая показывает связь между вирусными копиями и освещением генома (GCC). Вот как выглядят мои данные: Сначала я только построил линейную регрессию, но мои руководители сказали мне, что это неправильно, и попробовал сигмоидальную кривую. Поэтому я сделал это с помощью geom_smooth: library(scales) ggplot(scatter_plot_new, aes(x = Copies_per_uL, y …

2
Когда прекратить дорабатывать модель?
Я изучал статистику из многих книг за последние 3 года, и благодаря этому сайту я многому научился. Тем не менее, один фундаментальный вопрос все еще остается без ответа для меня. У него может быть очень простой или очень сложный ответ, но я точно знаю, что это требует некоторого глубокого понимания …

5
Что именно строит статистическую модель?
Что именно строит статистическую модель? В наши дни, когда я подаю заявку на исследовательскую работу или консультационную работу, часто появляется термин «построение модели» или «моделирование». Термин звучит круто, но к чему именно они относятся? Как вы строите свою модель? Я посмотрел прогнозное моделирование , которое включает в себя k-nn и …
15 modeling 

3
Либо квадратичный, либо член взаимодействия важен в изоляции, но ни один из них не вместе
В рамках задания мне нужно было дополнить модель двумя переменными предикторами. Затем мне пришлось нарисовать график остатков моделей по отношению к одному из включенных предикторов и внести изменения на основе этого. График показал криволинейную тенденцию, и поэтому я включил квадратный термин для этого предиктора. Новая модель показала значимость квадратичного члена. …

4
В поисках хорошей вводной обработки мета-анализа
Коллега (не статистик) сталкивался с метаанализом в статьях, которые он просматривает для медицинских журналов, и ищет хорошее начальное лечение, чтобы он мог самообразоваться. Любые рекомендации? Избранное? Книги, монографии, нетехнические обзорные статьи - все будет хорошо. (Да, он знаком со статьей в Википедии и другими вещами, легко доступными по поиску в …

5
Какой алгоритм статистической классификации может предсказать истину / ложь для последовательности входных данных?
Учитывая последовательность входов, мне нужно определить, обладает ли эта последовательность определенным желаемым свойством. Свойство может быть только истинным или ложным, то есть существует только два возможных класса, к которым может принадлежать последовательность. Точная связь между последовательностью и свойством неясна, но я считаю, что она очень последовательна и должна подойти для …

2
Моделирование распределения Пуассона с избыточной дисперсией
У меня есть набор данных, который я ожидаю, чтобы следовать распределению Пуассона, но он разбросан примерно в 3 раза. В настоящее время я моделирую эту избыточную дисперсию, используя что-то вроде следующего кода в R. ## assuming a median value of 1500 med = 1500 rawdist = rpois(1000000,med) oDdist = rawDist …

2
Что хорошего хорошего распределения степеней свободы в распределении?
Я хочу использовать при распределении для моделирования доходности активов с коротким интервалом в байесовской модели. Я хотел бы оценить обе степени свободы (наряду с другими параметрами в моей модели) для распределения. Я знаю, что доходность активов совершенно ненормальная, но я не знаю слишком много за этим. Что является подходящим, слегка …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.