Вопросы с тегом «linear-model»

Относится к любой модели, в которой случайная величина связана с одной или несколькими случайными переменными функцией, которая является линейной по конечному числу параметров.

2
Преобразование многомерной линейной модели в множественную регрессию
Является ли преобразование модели многомерной линейной регрессии в множественную линейную регрессию полностью эквивалентным? Я не имею в виду , просто запустив TTt отдельных регрессий. Я читал это в нескольких местах (Байесовский анализ данных - Гельман и др. И Многовариантная старая школа - Марден), что многомерная линейная модель может быть легко …

1
Хорошая посадка и какую модель выбрать линейную регрессию или Пуассона
Мне нужны некоторые советы относительно двух основных дилемм в моем исследовании, которое представляет собой исследование трех крупных фармацевтических препаратов и инноваций. Количество патентов в год является зависимой переменной. Мои вопросы Каковы наиболее важные критерии для хорошей модели? Что более / менее важно? Это то, что большинство или все переменные будут …

1
Условное ожидание R-квадрата
Рассмотрим простую линейную модель: Yy = X ′ ββ + ϵyy=X′ββ+ϵ\pmb{y}=X'\pmb{\beta}+\epsilon где ε я ~ я . я . д .N ( 0 , сг 2 )ϵi∼i.i.d.N(0,σ2)\epsilon_i\sim\mathrm{i.i.d.}\;\mathcal{N}(0,\sigma^2) и Х ∈ R п × рX∈Rn×pX\in\mathbb{R}^{n\times p} , р ≥ 2p≥2p\geq2 и ХXX содержит столбец констант. Мой вопрос заключается в том, что, …

3
Как можно получить хорошую модель линейной регрессии, если нет существенной корреляции между выходом и предикторами?
Я обучил модели линейной регрессии, используя набор переменных / функций. И модель имеет хорошие показатели. Однако я понял, что нет переменной с хорошей корреляцией с прогнозируемой переменной. Как это возможно?

2
Почему распределение T используется для проверки гипотез линейного коэффициента регрессии?
На практике использование стандартного T-критерия для проверки значимости коэффициента линейной регрессии является обычной практикой. Механика расчета имеет смысл для меня. Почему Т-распределение можно использовать для моделирования стандартной тестовой статистики, используемой при проверке гипотез линейной регрессии? Стандартная тестовая статистика, на которую я ссылаюсь: T0=βˆ−β0SE(βˆ)T0=β^−β0SE(β^) T_{0} = \frac{\widehat{\beta} - \beta_{0}}{SE(\widehat{\beta})}

2
Почему GLM отличается от LM с преобразованной переменной
Как поясняется в раздаточном материале этого курса (стр. 1) , линейная модель может быть записана в виде: y=β1x1+⋯+βpxp+εi,y=β1x1+⋯+βpxp+εi, y = \beta_1 x_{1} + \cdots + \beta_p x_{p} + \varepsilon_i, где - переменная ответа, а - пояснительная переменная .yyyxixix_{i}ithithi^{th} Часто с целью удовлетворения предположений теста можно преобразовать переменную ответа. Например, мы …

4
Классическая линейная модель - выбор модели
У меня классическая линейная модель, с 5 возможными регрессорами. Они не связаны друг с другом и имеют довольно низкую корреляцию с ответом. Я пришел к модели, в которой 3 регрессора имеют значимые коэффициенты для своей t-статистики (р <0,05). Добавление одной или обеих оставшихся 2 переменных дает значения p> 0,05 для …

3
Когда мы можем говорить о коллинеарности
В линейных моделях нам нужно проверить, существует ли связь между объясняющими переменными. Если они слишком сильно коррелируют, то возникает коллинеарность (то есть переменные частично объясняют друг друга). В настоящее время я просто смотрю на попарную корреляцию между каждой из объясняющих переменных. Вопрос 1: Что классифицирует как слишком большую корреляцию? Например, …

1
Понимание QR-разложения
У меня есть рабочий пример (в R), который я пытаюсь понять дальше. Я использую Limma для создания линейной модели, и я пытаюсь понять, что происходит шаг за шагом в вычислениях кратного изменения. Я в основном пытаюсь выяснить, что происходит для расчета коэффициентов. Из того, что я могу выяснить, QR-декомпозиция используется …

5
Могу ли я игнорировать коэффициенты для незначительных уровней факторов в линейной модели?
После поиска разъяснений по поводу коэффициентов линейной модели здесь у меня возник вопрос о не значащем значении (высокое значение p) для коэффициентов уровней факторов. Пример: если моя линейная модель включает в себя фактор с 10 уровнями, и только 3 из этих уровней имеют значимые значения p, связанные с ними, при …

2
VIF, индекс состояния и собственные значения
В настоящее время я оцениваю мультиколлинеарность в моих наборах данных. Какие пороговые значения VIF и индекса состояния ниже / выше указывают на проблему? VIF: я слышал, что VIF является проблемой.≥ 10≥10\geq 10 После удаления двух проблемных переменных VIF равен для каждой переменной. Нужно ли обрабатывать переменные или этот VIF-файл выглядит …

2
Матричная запись для логистической регрессии
В линейной регрессии (квадрат потери), используя матрицу, мы получаем очень краткие обозначения для цели minimize ∥Ax−b∥2minimize ‖Ax−b‖2\text{minimize}~~ \|Ax-b\|^2 Где AAA - матрица данных, xxx - коэффициенты, а bbb - ответ. Существует ли аналогичная матричная запись для цели логистической регрессии? Все записи, которые я видел, не могут избавиться от суммы по …

3
Для линейных классификаторов, большие коэффициенты подразумевают более важные особенности?
Я инженер-программист, работающий над машинным обучением. Насколько я понимаю, линейная регрессия (например, OLS) и линейная классификация (например, логистическая регрессия и SVM) делают прогноз на основе внутреннего произведения между обучаемыми коэффициентами и характеристическими переменными :вес⃗ вес→\vec{w}Икс⃗ Икс→\vec{x} Y^= ф( ш⃗ ⋅ х⃗ ) = f( ∑явесяИкся)Y^знак равное(вес→⋅Икс→)знак равное(ΣявесяИкся) \hat{y} = f(\vec{w} …

2
Смешивать непрерывные и двоичные данные с линейным SVM?
Так что я играл с SVM, и мне интересно, хорошо ли это делать: У меня есть набор непрерывных функций (от 0 до 1) и набор категориальных функций, которые я преобразовал в фиктивные переменные. В этом конкретном случае я кодирую дату измерения в фиктивной переменной: У меня есть 3 периода, из …

2
Если я повторю каждое наблюдение выборки в модели линейной регрессии и перезапущу регрессию, как повлияет на результат?
Скажем, у меня есть N наблюдений, возможно, несколько факторов, и я повторяю каждое наблюдение дважды (или М раз), как регрессия на этом новом наборе ЯМ размера будет сравниваться с регрессией только на исходных наблюдениях?

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.