Вопросы с тегом «regression»

Методы анализа взаимосвязи между одной (или несколькими) «зависимыми» переменными и «независимыми» переменными.

2
Почему Lasso или ElasticNet работают лучше, чем Ridge, когда функции взаимосвязаны
У меня есть набор из 150 функций, и многие из них тесно связаны друг с другом. Моя цель - предсказать значение дискретной переменной, диапазон которой составляет 1-8 . Мой размер выборки 550 , и я использую 10-кратную перекрестную проверку. AFAIK, среди методов регуляризации (Lasso, ElasticNet и Ridge), Ridge более строг …

3
Как решить, какую семью GLM использовать?
У меня есть данные о плотности рыбы, которые я пытаюсь сравнить между несколькими различными методами сбора, у данных есть много нулей, и гистограмма выглядит неопределенной, соответствующей распределению Пуассона, за исключением того, что, как плотности, это не целочисленные данные. Я относительно новичок в GLM и провел последние несколько дней в Интернете, …

3
Что означает отрицательный R-квадрат?
Допустим, у меня есть некоторые данные, а затем я подгоняю данные с помощью модели (нелинейная регрессия). Затем я вычисляю R-квадрат ( р2р2R^2 ). Когда R-квадрат отрицательный, что это значит? Значит ли это, что моя модель плохая? Я знаю, что диапазон р2р2R^2 может быть [-1,1]. Когда р2р2R^2 равен 0, что это …

3
Логистическая регрессия или Т-тест?
Группа людей отвечает на один вопрос. Ответ может быть «да» или «нет». Исследователь хочет знать, связан ли возраст с типом ответа. Связь была оценена с помощью логистической регрессии, где возраст - это объясняющая переменная, а тип ответа (да, нет) - зависимая переменная. Он был отдельно рассмотрен путем расчета среднего возраста …

2
Правильно ли использовать матрицу корреляции для выбора предикторов регрессии?
Несколько дней назад мой психолог-исследователь рассказал мне о своем методе выбора переменных для модели линейной регрессии. Думаю, это нехорошо, но мне нужно попросить кого-нибудь еще убедиться. Метод таков: Посмотрите на матрицу корреляции между всеми переменными (включая зависимую переменную Y) и выберите те предикторы Xs, которые больше всего коррелируют с Y. …

2
Имеет ли смысл использовать переменную даты в регрессии?
Я не привык использовать переменные в формате даты в R. Мне просто интересно, можно ли добавить переменную даты в качестве объясняющей переменной в модели линейной регрессии. Если это возможно, как мы можем интерпретировать коэффициент? Это влияние одного дня на итоговую переменную? Посмотрите мою суть с примером того, что я пытаюсь …

2
Обзор литературы по нелинейной регрессии
Кто-нибудь знает хорошую обзорную статью для статистической литературы по нелинейной регрессии? Меня в первую очередь интересуют результаты согласованности и асимптотики. Особый интерес представляет модель Yя т= м ( хя т, θ ) + ϵя т,YяTзнак равном(ИксяT,θ)+εяT,y_{it} = m(x_{it},\theta) + \epsilon_{it}, для данных панели. Менее интересны непараметрические методы. Предложения для журналов, …

3
Что такое нулевая модель в регрессии и как она связана с нулевой гипотезой?
Что такое нулевая модель в регрессии и какова связь между нулевой моделью и нулевой гипотезой? Насколько я понимаю, это значит Используя «среднее значение переменной отклика» для прогнозирования переменной непрерывного отклика? Использование «распределения меток» при прогнозировании дискретных переменных ответа? Если это так, то, похоже, отсутствует связь между нулевой гипотезой.

1
Обратная регрессия гребня: с учетом матрицы отклика и коэффициентов регрессии, найти подходящих предикторов
Рассмотрим стандартную задачу регрессии OLS \newcommand{\Y}{\mathbf Y}\newcommand{\X}{\mathbf X}\newcommand{\B}{\boldsymbol\beta}\DeclareMathOperator*{argmin}{argmin} : У меня есть матрицы YY\Y и XX\X и я хочу найти ββ\B чтобы минимизировать L=∥Y−Xβ∥2.L=‖Y−Xβ‖2.L=\|\Y-\X\B\|^2. Решение дается β^=argminβ{L}=(X⊤X)+X⊤Y.β^=argminβ⁡{L}=(X⊤X)+X⊤Y.\hat\B=\argmin_\B\{L\} = (\X^\top\X)^+\X^\top \Y. Я также могу поставить «обратную» проблему: учитывая YY\Y и β∗β∗\B^* , найдите X^X^\hat\X , который даст β^≈β∗β^≈β∗\hat\B\approx \B^* , то …

2
Почему регрессия гребня не сократит некоторые коэффициенты до нуля, как лассо?
При объяснении регрессии LASSO часто используется диаграмма ромба и круга. Говорят, что поскольку форма ограничения в LASSO представляет собой алмаз, полученное решение наименьших квадратов может касаться угла алмаза, так что оно приводит к усадке некоторой переменной. Однако в регрессии гребня, потому что это круг, он часто не будет касаться оси. …

1
В множественной линейной регрессии, почему график предсказанных точек не лежит на прямой линии?
Я использую множественную линейную регрессию для описания отношений между Y и X1, X2. Из теории я понял, что множественная регрессия предполагает линейные отношения между Y и каждым из X (Y и X1, Y и X2). Я не использую какие-либо преобразования X. Итак, я получил модель с R = 0,45 и …

1
Пирсон В.С. Остатки отклонений в логистической регрессии
Я знаю, что стандартизированные остатки Пирсона получены традиционным вероятностным способом: ri=yi−πiπi(1−πi)−−−−−−−−√ri=yi−πiπi(1−πi) r_i = \frac{y_i-\pi_i}{\sqrt{\pi_i(1-\pi_i)}} и Остаточные отклонения получаются более статистическим способом (вклад каждой точки в вероятность): di=si−2[yilogπi^+(1−yi)log(1−πi)]−−−−−−−−−−−−−−−−−−−−−−−−−−√di=si−2[yilog⁡πi^+(1−yi)log⁡(1−πi)] d_i = s_i \sqrt{-2[y_i \log \hat{\pi_i} + (1 - y_i)\log(1-\pi_i)]} где = 1, если y i = 1, и s i = -1, …

1
В каких именно условиях регрессия гребня способна обеспечить улучшение по сравнению с обычной регрессией наименьших квадратов?
Хребетная регрессия оценивает параметры в линейной модели by где - параметр регуляризации. Хорошо известно, что он часто работает лучше, чем регрессия OLS (с ), когда существует много коррелированных предикторов.у = Х & beta ; & beta ; А , = ( Х ⊤ Х + А , I ) - …

3
Литература по IV квантильной регрессии
В последние месяцы я интенсивно читал о квантильной регрессии, готовясь к моей магистерской диссертации этим летом. В частности, я прочитал большую часть книги Роджера Кенкера 2005 года на эту тему. Теперь я хочу расширить это существующее знание методами квантильной регрессии, которые учитывают инструментальные переменные (IV). Похоже, что это активная область …

2
Отображение пространственной и временной корреляции на картах
У меня есть данные для сети метеостанций по всей территории Соединенных Штатов. Это дает мне фрейм данных, который содержит дату, широту, долготу и некоторое измеренное значение. Предположим, что данные собираются один раз в день и определяются погодой регионального масштаба (нет, мы не будем вдаваться в это обсуждение). Я хотел бы …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.