Вопросы с тегом «regression»

Методы анализа взаимосвязи между одной (или несколькими) «зависимыми» переменными и «независимыми» переменными.

2
Проверка на статистически значимый пик
У меня есть набор данных, и . Я хотел бы проверить следующую гипотезу: есть пик ; то есть, когда увеличивается, сначала увеличивается, а затем уменьшается.yYyxxxyyyxxxyyy Моей первой идеей было подгонка и в зеркалке. То есть, если я обнаружу, что коэффициент до существенно положительный, а коэффициент до значительно отрицательный, я получу …

2
Разреженность путем отбрасывания коэффициента наименьших квадратов
Предположим, я хочу регрессировать против нормализованного X , но я бы хотел разреженного решения. Почему после регрессии недопустимо отбрасывать коэффициенты с наименьшей величиной?YYYXXX Для протокола, я слышал и часто использую методы LARS и LASSO. Мне просто любопытно, почему вышеуказанный подход не применим.

2
Что вы можете сделать, когда у вас есть предикторные переменные, основанные на средних значениях группы с различными размерами выборки?
Рассмотрим классическую задачу анализа данных, где у вас есть результат и как он связан с рядом предикторов . Основным типом приложения здесь является то, что Х я 1 , . , , , Х я рYiYiY_{i}Xi1,...,XipXi1,...,XipX_{i1}, ..., X_{ip} YiYiY_{i} - это некоторый результат на уровне группы, например, уровень преступности в …

1
Какой алгоритм прямой поэтапной регрессии?
Может быть, я просто устал, но у меня возникли проблемы при попытке понять алгоритм прямой поэтапной регрессии. Из раздела «Элементы статистического обучения», стр. 60: Прямая стадия регрессии (FS) еще более ограничена, чем прямая пошаговая регрессия. Он начинается как пошаговая регрессия вперед, с перехватом, равным [среднее значение] y, и центрированными предикторами …

1
Восстановление необработанных коэффициентов и дисперсий из ортогональной полиномиальной регрессии
Кажется, что если у меня есть регрессионная модель, такая как я могу либо подогнать необработанный полином и получить ненадежные результаты, либо подогнать ортогональный полином и получить коэффициенты которые не имеют прямой физической интерпретации (например, я не могу использовать их, чтобы найти места экстремумов в исходном масштабе). Похоже, я должен быть …

1
Какие существуют разные типы кодировок для категориальных переменных (в R) и когда вы будете их использовать?
Если вы подходите к линейной или смешанной модели, существуют различные типы кодировок, доступных для преобразования категориальной или номинальной вариабельной переменной в ряд переменных, для которых оцениваются параметры, такие как фиктивная кондукция (по умолчанию R) и кодирование эффектов. Я слышал, что кодирование эффектов (иногда называемое отклонением или контрастным кодированием) является предпочтительным, …

2
Вопрос о логистической регрессии
Я хочу запустить бинарную логистическую регрессию, чтобы смоделировать наличие или отсутствие конфликта (зависимой переменной) из набора независимых переменных в течение 10-летнего периода (1997-2006 гг.), Причем каждый год имеет 107 наблюдений. Мои независимые: деградация земель (категорически для 2 типов деградации); увеличение численности населения (0 - нет; 1 - да); тип средств …

4
«Модерация» против «взаимодействия»?
Я сталкивался с этими двумя терминами, которые взаимозаменяемы во многих контекстах. По сути, модератор (M) - это фактор, который влияет на отношения между X и Y. Анализ модерации обычно выполняется с использованием регрессионной модели. Например, пол (M) может влиять на отношения между «исследованием продукта» (X) и «покупкой продукта» (Y). Во …


2
Выбор модели Box-Jenkins
Процедура выбора модели Бокса-Дженкинса в анализе временных рядов начинается с рассмотрения автокорреляционных и частичных автокорреляционных функций ряда. Эти графики могут предложить соответствующие и в модели ARMA . Процедура продолжается, предлагая пользователю применить критерии AIC / BIC для выбора наиболее экономной модели среди тех, которые дают модель с ошибкой в ​​виде …


7
Стоит ли моделировать короткие временные ряды?
Вот некоторый контекст. Я заинтересован в определении того, как две переменные среды (температура, уровни питательных веществ) влияют на среднее значение переменной отклика за 11-летний период. В течение каждого года есть данные из более чем 100 тысяч мест. Цель состоит в том, чтобы определить, отразилось ли в течение 11-летнего периода среднее …

4
Сравнение логистических коэффициентов на моделях с различными зависимыми переменными?
Это дополнительный вопрос из того, который я задал пару дней назад . Я чувствую, что это ставит другой взгляд на проблему, поэтому перечислил новый вопрос. Вопрос в том, могу ли я сравнить величину коэффициентов по моделям с различными зависимыми переменными? Например, на одном примере скажем, что я хочу знать, является …

2
Вменяемая ступенчатая регрессия?
Предположим, я хочу построить двоичный классификатор. У меня есть несколько тысяч функций и только несколько десятков образцов. Исходя из знания предметной области, у меня есть веские основания полагать, что метка класса может быть точно предсказана с использованием всего лишь нескольких функций, но я не знаю, какие из них. Я также …

2
Интерпретация вывода drop1 в R
В R drop1команда выводит что-то аккуратное. Эти две команды должны получить какой-то вывод: example(step)#-> swiss drop1(lm1, test="F") Моя выглядит так: > drop1(lm1, test="F") Single term deletions Model: Fertility ~ Agriculture + Examination + Education + Catholic + Infant.Mortality Df Sum of Sq RSS AIC F value Pr(F) <none> 2105.0 190.69 …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.