Вопросы с тегом «predictive-models»

Прогнозирующие модели - это статистические модели, основной целью которых является оптимальное прогнозирование других наблюдений за системой, в отличие от моделей, целью которых является проверка конкретной гипотезы или механическое объяснение явления. Как таковые, прогнозирующие модели уделяют меньше внимания интерпретируемости и больше внимания производительности.

2
В байесовском умозаключении почему некоторые термины исключены из апостериорного предиктивного?
В сопряженном байесовском анализе гауссовского распределения Кевина Мерфи он пишет, что апостериорное предиктивное распределение p(x∣D)=∫p(x∣θ)p(θ∣D)dθp(x∣D)=∫p(x∣θ)p(θ∣D)dθ p(x \mid D) = \int p(x \mid \theta) p(\theta \mid D) d \theta где DDD - данные, к которым подходит модель, а xxx - невидимые данные. Я не понимаю, почему зависимость от DDD исчезает в …

1
Интерпретация коэффициентов регрессии LASSO
В настоящее время я работаю над созданием прогнозирующей модели для двоичного результата на наборе данных с ~ 300 переменными и 800 наблюдениями. Я много читал на этом сайте о проблемах, связанных со ступенчатой ​​регрессией, и почему бы не использовать ее. Я изучал регрессию LASSO и ее способность выбирать функции и …

4
Получение правильных начальных значений для модели NLS в R
Я пытаюсь приспособить простую модель степенного закона к набору данных, который выглядит следующим образом: mydf: rev weeks 17906.4 1 5303.72 2 2700.58 3 1696.77 4 947.53 5 362.03 6 Цель состоит в том, чтобы пропустить линию электропередачи и использовать ее для прогнозирования revзначений на будущие недели. Куча исследований привела меня …

1
Почему Netflix переключился бы со своей пятизвездочной рейтинговой системы на систему «нравится / не нравится»?
Netflix использовал свои предложения на основе предоставленных пользователем оценок других фильмов / шоу. Эта рейтинговая система имела пять звезд. Теперь Netflix позволяет пользователям нравится / не нравится (большие пальцы вверх / вниз) фильмы / шоу. Они утверждают, что фильмы легче оценивать. Разве эта двухсторонняя классификация не будет статистически менее предсказательной, …

1
Как интерпретировать результаты, когда гребень и лассо по отдельности работают хорошо, но дают разные коэффициенты
Я использую регрессионную модель с Лассо и Риджем (для прогнозирования дискретной переменной результата в диапазоне от 0 до 5). Перед запуском модели я использую SelectKBestметод, scikit-learnчтобы уменьшить набор функций с 250 до 25 . Без первоначального выбора признаков и Лассо, и Ридж уступают более низким показателям точности [что может быть …

1
Когда я должен прекратить искать модель?
Я ищу модель между запасами энергии и погодой. У меня есть цена на MWatt, купленная между странами Европы, и много ценностей на погоду (файлы Grib). Каждые часы на срок 5 лет (2011-2015). Цена / день Это в день на один год. У меня это по часам на 5 лет. Пример …

3
Регрессия с искаженными данными
Попытка рассчитать количество посещений из демографии и обслуживания. Данные очень искажены. Гистограммы: qq графики (слева - лог): m <- lm(d$Visits~d$Age+d$Gender+city+service) m <- lm(log(d$Visits)~d$Age+d$Gender+city+service) cityи serviceявляются факторными переменными. Я получаю низкое значение p *** для всех переменных, но я также получаю низкий r-квадрат 0,05. Что я должен делать? Будет ли работать …

2
Деревья решений и регрессия - Могут ли прогнозируемые значения выходить за пределы диапазона данных обучения?
Когда речь идет о деревьях решений, может ли прогнозируемое значение лежать вне диапазона обучающих данных? Например, если диапазон набора обучающих данных целевой переменной составляет 0-100, когда я генерирую свою модель и применяю ее к чему-то другому, могут ли мои значения быть -5? или 150? Учитывая, что я понимаю регрессию дерева …

3
Ресурсы для изучения многоцелевых методов?
Я ищу ресурсы (книги, конспекты лекций и т. Д.) О методах обработки данных с несколькими целями (например, три зависимые переменные: 2 дискретные и 1 непрерывная). У кого-нибудь есть ресурсы / знания по этому вопросу? Я знаю, что для этого можно использовать нейронные сети.

1
Метрика оценки прогноза для панельных / продольных данных
Я хотел бы оценить несколько различных моделей, которые обеспечивают предсказания поведения на ежемесячном уровне. Данные сбалансированы, и 100 000 и T = 12. В результате посещение концерта происходит в определенном месяце, поэтому оно равно нулю для ~ 80% людей в любом месяце, но есть длинный правый хвост для активных пользователей. …

2
Есть ли в этом модельном подходе
Мне недавно сказали, что процесс, которому я следовал (компонент тезиса MS), мог быть замечен как переоснащение. Я хочу лучше понять это и посмотреть, согласны ли другие. Целью этой части статьи является Сравните производительность деревьев градиентной ускоренной регрессии со случайными лесами в наборе данных. Посмотрите на производительность последней выбранной модели (GBM …


1
Доверительные интервалы для различия во временных рядах
У меня есть стохастическая модель, используемая для моделирования временных рядов какого-либо процесса. Меня интересует эффект изменения одного параметра на конкретное значение, и я хочу показать разницу между временными рядами (скажем, модель A и модель B) и своего рода доверительным интервалом, основанным на моделировании. Я просто запустил кучу симуляций из модели …

1
Прогнозирование процессов с длинной памятью
Я работаю с процессом с двумя состояниями с в дляИксTИксTx_t{ 1 , - 1 }{1,-1}\{1, -1\}t = 1 , 2 , …Tзнак равно1,2,...t = 1, 2, \ldots Функция автокорреляции указывает на процесс с длинной памятью, т. Е. Отображает затухание степенного закона с показателем степени <1. Вы можете смоделировать аналогичные ряды …

2
Какова интуиция, лежащая в основе рекуррентной нейронной сети с долговременной памятью (LSTM)?
Идея, лежащая в основе Recurrent Neural Network (RNN), мне ясна. Я понимаю это следующим образом: у нас есть последовательность наблюдений ( ) (или, другими словами, многомерный временной ряд). Каждое отдельное наблюдение является числовым вектором. В рамках RNN-модели мы предполагаем, что следующее наблюдение является функцией предыдущего наблюдения а также предыдущего "скрытого …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.