Вопросы с тегом «regression»

Методы анализа взаимосвязи между одной (или несколькими) «зависимыми» переменными и «независимыми» переменными.

2
Влияние функций и МНК
Я пытаюсь понять, как работают функции влияния. Может ли кто-то объяснить в контексте простой регрессии OLS yi=α+β⋅xi+εiyi=α+β⋅xi+εi\begin{equation} y_i = \alpha + \beta \cdot x_i + \varepsilon_i \end{equation} где я хочу функцию влияния для .ββ\beta

5
Как вычислить, имеет ли моя линейная регрессия статистически значимое отличие от известной теоретической линии?
У меня есть некоторые данные, которые соответствуют примерно линейной линии: Когда я делаю линейную регрессию этих значений, я получаю линейное уравнение: Y= 0,997 х - 0,0136Yзнак равно0,997Икс-0,0136y = 0.997x-0.0136 В идеальном мире уравнение должно быть .Y= хYзнак равноИксy = x Ясно, что мои линейные значения близки к этому идеалу, но …

5
Почему в линейной регрессии используется функция стоимости, основанная на вертикальном расстоянии между гипотезой и точкой входных данных?
Допустим, у нас есть входные (предикторные) и выходные (ответные) точки данных A, B, C, D, E, и мы хотим провести линию через точки. Это простая проблема для иллюстрации вопроса, но она может быть распространена и на более высокие измерения. Постановка задачи Текущее наилучшее соответствие или гипотеза представлена черной линией выше. …

5
Что означает, что линейная регрессия является статистически значимой, но имеет очень низкий r квадрат?
Я понимаю, что это означает, что модель плохо предсказывает отдельные точки данных, но установила устойчивую тенденцию (например, у возрастает, когда х повышается).

2
Почему линейная регрессия имеет допущение об остаточной, а обобщенная линейная модель имеет допущения об отклике?
Почему линейная регрессия и обобщенная модель имеют противоречивые предположения? В линейной регрессии мы предполагаем, что остаток происходит от гауссовой В другой регрессии (логистическая регрессия, регрессия яда) мы предполагаем, что ответ приходит из некоторого распределения (биномиальное, отравление и т. Д.). Почему иногда предполагают остаточное, а другое время предполагают на ответ? Это …

3
Почему справедливо отклонять временные ряды от регрессии?
Это вообще может быть странный вопрос, но как новичок в предмете, я задаюсь вопросом, почему мы используем регрессию для определения временного ряда, если одним из предположений регрессии является то, что данные должны быть указаны, в то время как данные, к которым применяется регрессия, являются не iid?

2
Учитывая две модели линейной регрессии, какая модель будет работать лучше?
Я взял курс машинного обучения в моем колледже. В одной из викторин был задан этот вопрос. Модель 1: y=θx+ϵy=θx+ϵ y = \theta x + \epsilon Модель 2: y=θx+θ2x+ϵy=θx+θ2x+ϵ y = \theta x + \theta^2 x + \epsilon Какая из вышеперечисленных моделей подойдет для данных лучше? (предположим, что данные могут быть …

4
Почему ? (Одна переменная линейная регрессия)
Примечание. = сумма квадратов, = сумма квадратов ошибок и = регрессионная сумма квадратов. Уравнение в названии часто записывается как:SSTSSTSSTSSESSESSESSRSSRSSR ∑i=1n(yi−y¯)2=∑i=1n(yi−y^i)2+∑i=1n(y^i−y¯)2∑i=1n(yi−y¯)2=∑i=1n(yi−y^i)2+∑i=1n(y^i−y¯)2\sum_{i=1}^n (y_i-\bar y)^2=\sum_{i=1}^n (y_i-\hat y_i)^2+\sum_{i=1}^n (\hat y_i-\bar y)^2 Довольно простой вопрос, но я ищу интуитивное объяснение. Интуитивно, мне кажется, что будет иметь больше смысла. Например, предположим, что точка имеет соответствующее значение …

2
Как сгладить данные и заставить монотонность
У меня есть некоторые данные, которые я хотел бы сгладить так, чтобы сглаженные точки монотонно уменьшались. Мои данные резко уменьшаются и затем начинают плато. Вот пример использования R df <- data.frame(x=1:10, y=c(100,41,22,10,6,7,2,1,3,1)) ggplot(df, aes(x=x, y=y))+geom_line() Какую хорошую технику сглаживания я мог бы использовать? Кроме того, было бы хорошо, если бы …

3
Глубокие нейронные сети - только для классификации изображений?
Все примеры, которые я нашел, используя глубокие убеждения или сверточные нейронные сети, используют их для классификации изображений, распознавания разговоров или распознавания речи. Полезны ли глубокие нейронные сети для классических задач регрессии, где функции не структурированы (например, не расположены в последовательности или сетке)? Если да, можете ли вы привести пример?

1
Почему модели со смешанными эффектами разрешают зависимость?
Скажем, нас интересует, как на экзаменационные оценки учеников влияет количество часов, которые они изучают. Чтобы исследовать это соотношение, мы могли бы запустить следующую линейную регрессию: exam.gradesi=a+β1×hours.studiedi+eiexam.gradesi=a+β1×hours.studiedi+ei \text{exam.grades}_i = a + \beta_1 \times \text{hours.studied}_i + e_i Но если мы выбираем учеников из нескольких разных школ, мы можем ожидать, что ученики в …

2
GLM: проверка выбора распределения и функции связи
У меня есть обобщенная линейная модель, которая использует гауссово распределение и функцию логарифмической связи. После подгонки модели я проверяю невязки: график QQ, невязки против прогнозируемых значений, гистограмма невязок (признавая, что необходима должная осторожность). Все выглядит хорошо. Мне кажется, это говорит о том, что выбор гауссовского распределения был вполне разумным. Или, …

1
От exp (коэффициентов) к коэффициенту шансов и их интерпретации в логистической регрессии с факторами
Я запустил линейную регрессию приема в колледж против баллов SAT и семейного / этнического происхождения. Данные являются вымышленными. Это продолжение предыдущего вопроса, на который уже дан ответ. Вопрос сосредоточен на сборе и интерпретации отношений шансов, оставляя оценки SAT в стороне для простоты. Переменные Accepted(0 или 1) и Background(«красный» или «синий»). …
14 r  regression  logistic 


5
Что именно цензурированные данные?
Я прочитал различные описания цензурированных данных: A) Как объяснено в этой теме, не количественные данные ниже или выше определенного порога подвергаются цензуре. Неколичественно означает, что данные выше или ниже определенного порога, но мы не знаем точного значения. Затем данные помечаются при низком или высоком пороговом значении в регрессионной модели. Это …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.