Вопросы с тегом «regression»

Методы анализа взаимосвязи между одной (или несколькими) «зависимыми» переменными и «независимыми» переменными.

1
Как ggplot вычисляет доверительные интервалы для регрессий?
Пакет построения графиков R ggplot2 имеет потрясающую функцию stat_smooth для построения линии регрессии (или кривой) с соответствующей доверительной полосой. Однако мне трудно понять, как именно генерируется этот доверительный интервал для каждого времени линии регрессии (или «метода»). Как я могу найти эту информацию?

7
Случайный лес переоснащается
Я пытаюсь использовать случайную лесную регрессию в scikits-learn. Проблема в том, что я получаю очень высокую ошибку теста: train MSE, 4.64, test MSE: 252.25. Вот как выглядят мои данные: (синий: реальные данные, зеленый: прогноз): Я использую 90% для обучения и 10% для тестирования. Это код, который я использую после попытки …

1
Регрессия ошибок в переменных: допустимо ли объединение данных с трех сайтов?
Недавно ко мне пришел клиент, чтобы выполнить анализ начальной загрузки, потому что рецензент FDA сказал, что их регрессия ошибок в переменных была недействительной, потому что при объединении данных с сайтов анализ включал объединение данных с трех сайтов, где два сайта включали некоторые выборки, которые были то же самое. ФОН У …

3
Автоматизированная процедура выбора подмножества точек данных с сильнейшей корреляцией?
Существует ли какая-либо стандартная процедура (такая, чтобы ее можно было назвать в качестве справочной) для выбора подмножества точек данных из большего пула с самой сильной корреляцией (только по двум измерениям)? Например, скажем, у вас есть 100 точек данных. Вам нужно подмножество из 40 точек с максимально возможной корреляцией по измерениям …

2
Как выбрать между различными скорректированными формулами ?
Я имею в виду скорректированные формулы R-квадрата, предложенные: Иезекииль (1930), который, как мне кажется, в настоящее время используется в SPSS. R2adjusted=1−(N−1)(N−p−1)(1−R2)Radjusted2=1−(N−1)(N−p−1)(1−R2)R^2_{\rm adjusted} = 1 - \frac{(N-1)}{(N-p-1)} (1-R^2) Олкин и Пратт (1958) р2у п б я ы е д= 1 - ( N- 3 ) ( 1 - R2)( N- р …

2
Как выбрать уровень значимости для большого набора данных?
Я работаю с набором данных, имеющих N около 200 000. В регрессиях я вижу очень маленькие значения значимости << 0,001, связанные с очень маленькими величинами эффекта, например, r = 0,028. Я хотел бы знать, есть ли принципиальный способ определения подходящего порога значимости по отношению к размеру выборки? Есть ли другие …

5
В чем может быть причина использования преобразования квадратного корня в данных?
Есть ли причина того, что я могу придумать, чтобы преобразовать данные с квадратным корнем? Я имею в виду, что я всегда наблюдаю, что R ^ 2 увеличивается. Но это, вероятно, только из-за центрирования данных! Любая мысль ценится!

4
Доверительные интервалы для параметров регрессии: байесовский или классический
Учитывая два массива x и y длиной n, я подгоняю модель y = a + b * x и хочу рассчитать 95% доверительный интервал для наклона. Это (b - дельта, b + дельта), где b находится обычным образом и delta = qt(0.975,df=n-2)*se.slope и se.slope - стандартная ошибка на склоне. Один …

5
Как моделировать цены?
Я задал этот вопрос на сайте обмена стеками matemathics, и его рекомендовали задать здесь. Я работаю над хобби-проектом и мне нужна помощь в решении следующей проблемы. Немного контекста Допустим, есть коллекция предметов с описанием возможностей и ценой. Представьте себе список автомобилей и цены. У всех автомобилей есть список характеристик, например, …

5
Можно ли использовать множественную регрессию для прогнозирования одного главного компонента (ПК) от нескольких других ПК?
Некоторое время назад пользователь из списка рассылки R-help спросил о целесообразности использования оценок PCA в регрессии. Пользователь пытается использовать некоторые оценки ПК для объяснения изменений на другом ПК (см. Полное обсуждение здесь ). Ответ был таков: нет, это не так, потому что компьютеры ортогональны друг другу. Может кто-нибудь объяснить немного …
15 regression  pca 

5
Почему предположение о нормальности в линейной регрессии
Мой вопрос очень прост: почему мы выбираем нормальное в качестве распределения, которому следует термин ошибки в предположении о линейной регрессии? Почему мы не выбираем других, как униформу, т или как?

5
Зачем нужны предположения в линейной регрессии?
В линейной регрессии мы делаем следующие предположения Среднее значение ответа E(Yi)E(Yi)E(Y_i) каждого набора значений предикторов (x1i,x2i,…)(x1i,x2i,…)(x_{1i}, x_{2i},…) является линейной функцией предикторов. Ошибки являются независимыми.εiεiε_i Ошибки при каждом наборе значений предикторов (x_ {1i}, x_ {2i},…) распределяются нормально.εiεiε_i(x1i,x2i,…)(x1i,x2i,…)(x_{1i}, x_{2i},…) Ошибки εiεiε_i при каждом наборе значений предикторов (x1i,x2i,…)(x1i,x2i,…)(x_{1i}, x_{2i},…) имеют равные дисперсии (обозначенные …

4
Доказательство эквивалентных формул гребневой регрессии
Я прочитал самые популярные книги в области статистического обучения 1- Элементы статистического обучения. 2- Введение в статистическое обучение . Оба упоминают, что у регрессии гребня есть две формулы, которые эквивалентны. Есть ли понятное математическое доказательство этого результата? Я также прошел Cross Validated , но я не могу найти однозначного доказательства …

2
Нейронные сети против всего остального
Я не нашел удовлетворительного ответа на этот вопрос от Google . Конечно, если у меня есть данные порядка нескольких миллионов, то глубокое обучение - это путь. И я прочитал, что, когда у меня нет больших данных, тогда, возможно, лучше использовать другие методы в машинном обучении. Приведенная причина является чрезмерной. Машинное …

1
Сравнение Ньюи-Уэста (1987) и Хансена-Ходрика (1980)
Вопрос: Каковы основные различия и сходства между использованием стандартных ошибок Newey-West (1987) и Hansen-Hodrick (1980)? В каких ситуациях одна из них должна быть предпочтительнее другой? Примечания: Я знаю, как работает каждая из этих процедур настройки; однако я еще не нашел ни одного документа, который бы сравнивал их, ни в Интернете, …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.