Вопросы с тегом «regression»

Методы анализа взаимосвязи между одной (или несколькими) «зависимыми» переменными и «независимыми» переменными.

2
Отчетность о результатах простой линейной регрессии: какую информацию включить?
Я только что выполнил (очень) простую линейную регрессию в Genstat и хотел бы включить краткую и содержательную сводку результатов в мой отчет. Я не уверен, что именно или сколько информации я должен включать. Основные биты моего вывода Genstat выглядят так: Summary of analysis Source d.f. s.s. m.s. v.r. F pr. …

1
Какие остатки и расстояние Кука используются для GLM?
Кто-нибудь знает, какова формула расстояния Кука? В оригинальной формуле расстояния Кука используются нечеткие невязки, но почему R использует стандартное отклонение. Остатки Пирсона при расчете расстояния Кука для GLM. Я знаю, что для GLM не определены стедентифицированные невязки, но как выглядит формула для вычисления расстояния Кука? Предположим следующий пример: numberofdrugs <- …

1
Насколько различны ограниченные кубические сплайны и штрафные сплайны?
Я много читаю об использовании сплайнов в различных регрессионных задачах. В некоторых книгах (например, в линейных моделях Парриметриза Ходжеса ) рекомендуются штрафные сплайны. Другие (например, стратегии регрессионного моделирования Харрелла ) выбирают ограниченные кубические сплайны. Насколько они отличаются на практике? Часто ли вы получаете существенно отличающиеся результаты от использования одного или …

1
Что означает термин «редкий априорный» (FBProphet Paper)?
Читая статью «Прогнозирование в масштабе» (инструмент прогнозирования FBProphet, см. Https://peerj.com/preprints/3190.pdf ), я натолкнулся на термин «разреженный априор». Авторы объясняют, что они использовали такой «разреженный априор» при моделировании вектора отклонений скорости δδ\mathbf{\delta} от некоторой скалярной скорости Кkk , которая является модельным параметром в модели логистического роста. Поскольку они утверждают, что δJ∼ …

1
Как рассчитать доверительные оценки в регрессии (со случайными лесами / XGBoost) для каждого прогноза в R?
Есть ли способ получить показатель достоверности (мы можем также назвать его значением достоверности или вероятности) для каждого прогнозируемого значения при использовании таких алгоритмов, как Random Forests или Extreme Gradient Boosting (XGBoost)? Допустим, этот показатель доверия будет варьироваться от 0 до 1 и покажет, насколько я уверен в том или ином …

1
Почему LKJcorr является хорошим приоритетом для корреляционной матрицы?
Я читаю главу 13 «Приключения в ковариации» в ( превосходной ) книге Ричарда Мак-Элирея « Статистическое переосмысление », где он представляет следующую иерархическую модель: ( Rэто корреляционная матрица) Автор объясняет, что LKJcorrэто слабоинформативный априор, который работает как регуляризирующий априор для корреляционной матрицы. Но почему это так? Какие характеристики у LKJcorrраспределения …

3
Проблемы с горячим кодированием и фиктивным кодированием
Мне известен тот факт, что категориальные переменные с k уровнями должны кодироваться с помощью k-1 переменных в фиктивном кодировании (аналогично для многозначных категориальных переменных). Мне было интересно, сколько проблем делает одноразовое кодирование (то есть использование вместо этого k переменных) вместо фиктивного кодирования для различных методов регрессии, в основном, линейной регрессии, …

3
Каковы преимущества ступенчатой ​​регрессии?
Я экспериментирую со ступенчатой ​​регрессией ради разнообразия в моем подходе к проблеме. Итак, у меня есть 2 вопроса: Каковы преимущества ступенчатой ​​регрессии? Каковы его конкретные сильные стороны? Что вы думаете о гибридном подходе, где вы используете ступенчатую регрессию для выбора объектов, а затем применяете регулярную регрессию, объединяя все выбранные объекты …

2
Инкрементная Гауссова регрессия процесса
Я хочу реализовать постепенную гауссовскую регрессию процесса, используя скользящее окно над точками данных, которое приходит один за другим через поток. Пусть обозначает размерность входного пространства. Итак, каждая точка данных имеет количество элементов.dddxixix_iddd Пусть будет размером скользящего окна.nnn Чтобы делать предсказания, мне нужно вычислить обратную матрицу грамм , где а k …

5
Статистика теста Дурбина Уотсона
Я применил тест DW к моей регрессионной модели в R, и я получил статистику теста DW 1,78 и значение p 2,2e-16 = 0. Означает ли это, что не существует автокорреляции между невязками, потому что stat близок к 2 с небольшим p-значением, или это означает, что хотя stat близок к 2, …

1
Являются ли оценки коэффициентов регрессии некоррелированными?
Рассмотрим простую регрессию (нормальность не предполагается): где со средним и стандартным отклонением . Являются ли оценки наименьших квадратов и некоррелированными?Yi=a+bXi+ei,Yi=a+bXi+ei,Y_i = a + b X_i + e_i,eieie_i000σσ\sigmaaaabbb

1
Допущение нормальности в линейной регрессии
В качестве допущения о линейной регрессии нормальность распределения ошибки иногда ошибочно «расширяется» или интерпретируется как необходимость нормальности y или x. Можно ли построить сценарий / набор данных, где X и Y ненормальны, но ошибочный член есть, и, следовательно, полученные оценки линейной регрессии действительны?


2
Случайный лес на сгруппированных данных
Я использую случайный лес на многомерных сгруппированных данных (50 числовых входных переменных), которые имеют иерархическую структуру. Данные были собраны с 6 повторениями в 30 положениях 70 различных объектов, что привело к 12600 точкам данных, которые не являются независимыми. Кажется, что случайный лес перегружает данные, так как ошибка oob намного меньше …

3
Как рассчитать разницу двух склонов?
Есть ли способ понять, если две линии (более или менее) параллельны? У меня есть две линии, сгенерированные из линейных регрессий, и я хотел бы понять, параллельны ли они. Другими словами, я хотел бы получить разные наклоны этих двух линий. Есть ли функция R для расчета этого? РЕДАКТИРОВАТЬ: ... и как …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.