Вопросы с тегом «predictive-models»

Прогнозирующие модели - это статистические модели, основной целью которых является оптимальное прогнозирование других наблюдений за системой, в отличие от моделей, целью которых является проверка конкретной гипотезы или механическое объяснение явления. Как таковые, прогнозирующие модели уделяют меньше внимания интерпретируемости и больше внимания производительности.

1
Надежные методы действительно лучше?
У меня есть две группы субъектов, A и B, каждая из которых имеет размер около 400 и около 300 предикторов. Моя цель - построить модель прогнозирования для бинарной переменной ответа. Мой клиент хочет увидеть результат применения модели, построенной из A на B. (В своей книге «Стратегии регрессионного моделирования», @FrankHarrell упоминает, …

2
Модель выживания для прогнозирования оттока - изменяющиеся во времени предикторы?
Я рассчитываю построить прогностическую модель для прогнозирования оттока и использовать модель выживания с дискретным временем, адаптированную к набору данных за период человека (одна строка для каждого клиента и дискретный период, в котором они находились под угрозой, с показателем для события - равным 1 если отток произошел в тот период, иначе …

1
Как интерпретировать вывод предиката .coxph?
После подбора кокс-модели можно делать прогнозы и получать относительный риск новых данных. Что я не понимаю, так это то, как относительный риск рассчитывается для человека и к чему он относится (то есть для среднего населения)? Любые рекомендации по ресурсам, которые помогут понять (я не очень продвинут в анализе выживания, поэтому …

4
О Джордже Боксе, Галите Шмуэли и научном методе?
(Этот вопрос может показаться, что он лучше подходит для Philosophy SE. Я надеюсь, что статистики смогут уточнить мои неправильные представления о высказываниях Бокса и Шмуэли, поэтому я публикую его здесь). Джордж Бокс (из известности ARIMA) сказал: «Все модели ошибочны, но некоторые полезны». Галит Шмуэли в своей знаменитой статье «Объяснить или …

6
Самая быстрая реализация SVM
Больше общего вопроса. Я использую rbf SVM для прогнозного моделирования. Я думаю, что моя текущая программа определенно нуждается в ускорении. Я использую Scikit Learn с грубым, чтобы точный поиск сетки + перекрестная проверка. Каждый запуск SVM занимает около минуты, но со всеми итерациями я все еще нахожу его слишком медленным. …


5
Является ли это мошенничеством, чтобы отбросить выбросы, основанные на диаграмме средней абсолютной ошибки, чтобы улучшить регрессионную модель
У меня есть модель прогнозирования, протестированная четырьмя методами, как вы можете видеть на рисунке ниже. Атрибут, который предсказывает модель, находится в диапазоне 0-8. Вы можете заметить, что во всех методах указаны один выброс верхней границы и три выброса нижней границы . Интересно, уместно ли удалять эти экземпляры из данных? Или …

2
Как сделать перекрестную проверку с помощью модели пропорциональных рисков Кокса?
Предположим, что я построил модель прогнозирования возникновения конкретной болезни в одном наборе данных (набор данных построения модели) и теперь хочу проверить, насколько хорошо модель работает в новом наборе данных (набор данных проверки). Для модели, построенной с логистической регрессией, я рассчитал бы прогнозируемую вероятность для каждого человека в наборе данных проверки …

1
Минимизация смещения в объяснительном моделировании, почему? (Галита Шмуэли «Объяснять или предсказывать»)
Этот вопрос ссылается на статью Галита Шмуэли «Объяснить или предсказать» . В частности, в разделе 1.5 «Объяснения и предсказания различны» профессор Шмуэли пишет: При объяснительном моделировании основное внимание уделяется минимизации смещения для получения наиболее точного представления основной теории. Это озадачивало меня каждый раз, когда я читал газету. В каком смысле …

2
Почему это предсказание временного ряда «довольно плохое»?
Я пытаюсь научиться использовать нейронные сети. Я читал этот урок . После подбора нейронной сети по временному ряду, используя значение в для прогнозирования значения в момент времени t + 1, автор получает следующий график, где синяя линия - это временной ряд, зеленый - это прогноз данных поезда, красный - это …

4
Прогнозирующие модели: статистика не может превзойти машинное обучение? [закрыто]
Закрыто . Этот вопрос должен быть более сфокусированным . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он был сосредоточен только на одной проблеме, отредактировав этот пост . Закрыто 2 года назад . В настоящее время я слежу за магистерской программой, ориентированной на статистику …

4
Может ли метод случайного леса применяться к линейным регрессиям?
Случайные леса работают путем создания множества деревьев решений, где каждое дерево создается с использованием начальной загрузки исходных обучающих данных (выборка как входных переменных, так и наблюдений). Можно ли применить аналогичный процесс для линейной регрессии? Создайте k моделей линейной регрессии, используя случайную выборку начальной загрузки для каждой из k регрессий Каковы …

2
Модель производительности в квантовом моделировании
Я использую квантильную регрессию (например, через gbmили quantregв R) - фокусируюсь не на медиане, а на верхнем квантиле (например, 75-й). Исходя из опыта прогнозного моделирования, я хочу измерить, насколько хорошо модель вписывается в набор тестов, и иметь возможность описать это для бизнес-пользователя. Мой вопрос как? В типичной обстановке с непрерывной …

1
Прогнозирующая эффективность зависит больше от опыта аналитика данных, чем от метода?
Я сталкивался со слухами о том, что некоторые исследования показали, что эффективность прогностических моделей больше зависит от опыта аналитика данных с выбранным методом, чем от выбора метода. Другими словами, утверждается, что более важно, чтобы аналитик данных был знаком с выбранным методом, чем то, насколько «подходящим» этот метод может показаться для …

1
Карет глмнет против cv.glmnet
Кажется, существует большая путаница при сравнении использования glmnetвнутри caretдля поиска оптимальной лямбды и использования cv.glmnetдля выполнения той же задачи. Было задано много вопросов, например: Модель классификации train.glmnet против cv.glmnet? Как правильно использовать glmnet с кареткой? Перекрестная проверка `glmnet` с использованием` caret` но ответа не дано, что может быть связано с …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.