Вопросы с тегом «bias»

Разница между ожидаемым значением оценщика параметра и истинным значением параметра. НЕ используйте этот тег для ссылки на [bias-term] / [bias-node] (то есть [intercept]).

3
Смещение логистической регрессии редких событий: как смоделировать недооцененные p с минимальным примером?
У CrossValidated есть несколько вопросов о том, когда и как применять коррекцию смещения редкого события, разработанную King and Zeng (2001) . Я ищу что-то другое: минимальную демонстрацию, основанную на симуляции, которая существует. В частности, король и дзенг «... в данных по редким событиям смещения вероятностей могут быть существенно значимыми с …

1
Когда слово «уклон» был придуман для среднего
Когда слово «уклон» был придуман для среднего ?E[θ^−θ]E[θ^−θ]\mathbb{E}[\hat{\theta}-\theta] Причина, по которой я сейчас думаю об этом, заключается в том, что я, кажется, вспоминаю Джейнса в его тексте теории вероятностей , критикуя использование слова «смещение», использованного для описания этой формулы, и предлагая альтернативу. Из теории вероятностей Джейнса , раздел 17.2 «Несмещенные …

7
Смещенные данные в машинном обучении
Я работаю над проектом машинного обучения с данными, которые уже (сильно) смещены при выборе данных. Предположим, у вас есть набор жестко закодированных правил. Как вы строите модель машинного обучения, чтобы заменить ее, когда все данные, которые она может использовать, являются данными, которые уже были отфильтрованы по этим правилам? Чтобы прояснить …

2
Существует ли графическое представление компромисса смещения в линейной регрессии?
Я страдаю от затемнения. Мне представили следующую картину, чтобы продемонстрировать компромисс смещения дисперсии в контексте линейной регрессии: Я вижу, что ни одна из двух моделей не подходит - «простая» не оценивает сложность отношения XY, а «сложная» просто переобучается, в основном, выучивая данные обучения наизусть. Однако я совершенно не вижу смещения …

6
Есть ли пример, где MLE дает необъективную оценку среднего значения?
Можете ли вы привести пример оценки MLE среднего значения, которое смещено? Я не ищу пример, который нарушает оценки MLE в целом, нарушая условия регулярности. Все примеры, которые я вижу в Интернете, относятся к расхождению, и я не могу найти ничего, связанного со средним значением. РЕДАКТИРОВАТЬ @MichaelHardy предоставил пример, в котором …

1
Опущенное переменное смещение в логистической регрессии по сравнению с пропущенным переменным смещением в обычной регрессии наименьших квадратов
У меня есть вопрос об опущенном переменном смещении в логистической и линейной регрессии. Скажем, я опускаю некоторые переменные из модели линейной регрессии. Сделайте вид, что эти пропущенные переменные не связаны с переменными, которые я включил в мою модель. Эти пропущенные переменные не смещают коэффициенты в моей модели. Но в логистической …

2
Вопрос о компромиссном отклонении
Я пытаюсь понять компромисс между отклонением оценки, отношением между отклонением оценки и отклонением модели, а также отношением между дисперсией оценки и дисперсией модели. Я пришел к этим выводам: Мы склонны переписывать данные, когда пренебрегаем смещением оценки, то есть когда мы стремимся минимизировать смещение модели, пренебрегая дисперсией модели (другими словами, мы …

1
Минимизация смещения в объяснительном моделировании, почему? (Галита Шмуэли «Объяснять или предсказывать»)
Этот вопрос ссылается на статью Галита Шмуэли «Объяснить или предсказать» . В частности, в разделе 1.5 «Объяснения и предсказания различны» профессор Шмуэли пишет: При объяснительном моделировании основное внимание уделяется минимизации смещения для получения наиболее точного представления основной теории. Это озадачивало меня каждый раз, когда я читал газету. В каком смысле …

4
Почему дерево решений имеет низкий уклон и высокую дисперсию?
Вопросов Зависит ли это от того, мелкое дерево или глубокое? Или мы можем сказать это независимо от глубины / уровня дерева? Почему уклон низкий и дисперсия высокая? Пожалуйста, объясните интуитивно и математически

3
Нужно ли включать «все соответствующие предикторы»?
Основное предположение об использовании регрессионных моделей для вывода заключается в том, что «все соответствующие предикторы» были включены в уравнение прогнозирования. Обоснование состоит в том, что отказ от включения важного фактического фактора приводит к смещенным коэффициентам и, следовательно, к неточным выводам (т. Е. Пропускается переменное смещение). Но в исследовательской практике я …

2
Высокая дисперсия перекрестной проверки по принципу «один-один-один»
Я читал снова и снова, что перекрестная проверка «Оставить один» имеет высокую дисперсию из-за большого перекрытия тренировочных сгибов. Однако я не понимаю, почему это так: не должны ли результаты перекрестной проверки быть очень стабильными (низкая дисперсия) именно потому, что тренировочные наборы практически идентичны? Или я неправильно понимаю понятие «дисперсия»? Я …

1
Случайная проблема с параметрами
Я всегда изо всех сил пытаюсь понять истинную суть проблемы случайных параметров. Я несколько раз читал, что оценки фиксированных эффектов нелинейных панельных моделей данных могут быть сильно смещены из-за «хорошо известной» проблемы побочных параметров. Когда я прошу дать четкое объяснение этой проблемы, типичный ответ таков: предположим, что данные панели содержат …

2
Для каких моделей смещение MLE падает быстрее, чем дисперсия?
Пусть θ будет оценка максимального правдоподобия истинного параметра некоторой модели. По мере увеличения числа точек данных ошибка обычно уменьшается как O (1 / \ sqrt n) . Используя неравенство треугольника и свойства ожидания, можно показать, что этот коэффициент ошибок подразумевает, что оба «смещения» \ lVert \ mathbb E \ hat …

4
Предвзятость в выборе жюри?
Друг представляет клиента по апелляции после уголовного процесса, в ходе которого выясняется, что выбор присяжных был расистским. Жюри состояло из 30 человек в 4 расовых группах. Обвинение использовало императивные вызовы, чтобы исключить 10 из этих людей из пула. Количество людей и количество реальных проблем в каждой расовой группе были, соответственно: …

2
Предоставляет ли ступенчатая регрессия необъективную оценку r-квадрата населения?
В психологии и других областях часто используется форма ступенчатой ​​регрессии, которая включает в себя следующее: Посмотрите на остальные предикторы (сначала их нет в модели) и определите предиктор, который приведет к наибольшему изменению r-квадрата; Если значение p изменения r-квадрата меньше, чем альфа (обычно 0,05), включите этот предиктор и вернитесь к шагу …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.