Перевод проблемы машинного обучения в регрессионную структуру

Предположим, у меня есть панель объясняющих переменных , для , , а также вектор двоичных результатов зависимых переменных . Таким образом, наблюдается только в последний момент времени а не в любое более раннее время. Полностью общий случай состоит в том, чтобы иметь несколько для для каждой единицы в каждый момент времени $X_{it}$ $i = 1 ... N$ $t = 1 ... T$ $Y_{iT}$ $Y$ $T$ $X_{ijt}$ $j=1...K$ $i$ $t$ , но давайте сосредоточимся на случае для краткости. $K=1$

Применения таких «несбалансированных» пар с временными коррелированными объяснительными переменными, например, (ежедневные цены на акции, ежеквартальные дивиденды), (ежедневные отчеты о погоде, годовые ураганы) или (особенности шахматной позиции после каждого хода, результат выигрыша / проигрыша на конец игры). $(X, Y)$

Я заинтересован в (возможно нелинейном) регрессии коэффициенты для этого предсказания в , зная , что в обучающих данных, учитывая ранние наблюдения для , то это приводит к окончательному результату $\beta_t$ $Y_{it}$ $X_{it}$ $t < T$ $Y_{iT}$

$\hat{Y}_{it} = f(\sum_{k=1}^{t} X_{ik} \beta_k), \quad t = 1 ... T$

Исходя из эконометрического фона, я не видел большого регрессионного моделирования, применяемого к таким данным. OTOH, я видел следующие методы машинного обучения, применяемые к таким данным:

проводить контролируемое обучение на всем наборе данных, например, минимизировать

$\sum_{i,t}\frac{1}{2}(Y_{it} - f(X_{it} \beta_t))^2$

просто экстраполируя / вменяя наблюдаемый во все предыдущие моменты времени $Y$

$Y_{it} \equiv Y_{iT}, \quad t = 1... T-1$

Это кажется «неправильным», потому что оно не будет учитывать временную корреляцию между различными моментами времени.

делая подкрепление обучения , такие как временная разница с-обучение параметра ; и дисконтный параметр , и рекурсивно решения для через обратное распространение , начиная с $\alpha$ $\lambda$ $\beta_t$ $t=T$

$\Delta \beta_{t} = \alpha (\hat{Y}_{t+1} - \hat{Y}_{t}) \sum_{k=1}^{t} \lambda^{t-k} \nabla_{\beta} \hat{Y}_{k}$

с является градиент по отношению к . $\nabla_{\beta} \hat{Y}$ $f()$ $\beta$

Это кажется более «правильным», поскольку учитывает временную структуру, но параметры и являются своего рода «специальными». $\alpha$ $\lambda$

Вопрос : есть ли литература о том, как отобразить вышеприведенные методы обучения под наблюдением / подкреплением в регрессионную структуру, используемую в классической статистике / эконометрике? В частности, я хотел бы иметь возможность оценивать параметры за один раз (то есть для всех одновременно), выполняя (нелинейные) наименьшие квадраты или максимальное правдоподобие для таких моделей в качестве $\beta_{t}$ $t=1...T$

$Y_{iT} = f(\sum_{t=1}^T X_{it} \beta_{t}) + \epsilon_{i}$

Мне также было бы интересно узнать, могут ли временные различия обучения мета-параметров и быть восстановлены из формулировки максимального правдоподобия. $\alpha$ $\lambda$

regression machine-learning reinforcement-learning

— TemplateRex
источник

Не могли бы вы уточнить формулировку в третьем абзаце? Вы пишете, что хотите предсказать

из

, но следующая формула предполагает, что вы хотите предсказать

Y_{i T}

$Y_{iT}$

X_{i t}

$X_{it}$

t < T

$t < T$

Y_{i t}

$Y_{it}$

— NRH

@NRH на самом деле, я наблюдаю только

, но то, что я видел в литературе по контролируемому обучению, это то, что они вменяют ненаблюдаемый

чтобы быть равным

а затем делают примерку, чтобы фактически объяснить эту фальшивку

from

(это делается в игровых приложениях, где функция оценки для каждой позиции соответствует конечному результату игры). Извините, если это не было ясно из моей первоначальной формулировки. В любом

Y_{i T}

$Y_{iT}$

Y_{i t}

$Y_{it}$

Y_{i T}

$Y_{iT}$

Y_{i t}

$Y_{it}$

X_{i t}

$X_{it}$

{\hat{Y}}_{i t}

$\hat{Y}_{it}$ будет прогнозируемый «результат» (в игровых приложениях), учитывая наблюдаемые события

X_{i t}

$X_{it}$

— TemplateRex

Я понимаю настрой и то, что вы наблюдаете, но ваша формулировка в вопросе неясна. Вы хотите обучить модель для предсказания

как вы пишете словами, или вы хотите обучить модель для предсказания

для всех

как предлагают формулы? Может быть, это просто опечатка. Когда вы пишете «... прогноз по

...» вы имеете в виду «... предсказание из

...»?

Y_{i T}

$Y_{iT}$

Y_{i t}

$Y_{it}$

t

$t$

Y_{i T}

$Y_{iT}$

Y_{i t}

$Y_{it}$

— NRH

Непонятно, почему вы хотите это сделать. Если вы сможете объяснить фактическое практическое применение, вы можете получить более четкие ответы. В общем, лучший прогноз для каждого временного интервала будет просто делать регрессию

на доступных данных

отдельно для каждого t. Не очевидно, что одновременный подход имеет какую-либо выгоду. Я думаю, что вы должны указать статистическую модель для своего набора данных, и тогда, возможно, преимущества будут более ясными.

Y_{T}

$Y_T$

X_{1}, \dots, X_{t}

$X_1,\dots,X_t$

— seanv507

@NRH, да, я хочу предсказать

из

зная, что это приводит к результату

в данных обучения, чтобы предпринять оптимальные действия для тестовых данных, где я также наблюдаю

но еще не заметил результат. Буду обновлять мою формулировку.

Y_{i t}

$Y_{it}$

X_{i t}

$X_{it}$

Y_{i T}

$Y_{iT}$

X_{i t}

$X_{it}$

— TemplateRex

Описание проблемы мне не совсем понятно, поэтому я пытаюсь угадать некоторые предположения. Если это не ответит на ваш вопрос, это может, по крайней мере, помочь прояснить проблемы дальше.

Первое, что мне не понятно, это данные, на которых вы хотите основать свой прогноз. Если вы хотите предсказать на основе наблюдаемых данных, пока то рекурсивный подход, как в вашем методе 2., не имеет смысла, поскольку при этом будут использоваться будущие данные, то есть с . $Y_T$ $t<T$ $X_\tau$ $\tau>t$

$Y_t$ $X_1,\ldots, X_t$ $t<T$ $Y_t=\text{E}[Y_T \mid X_1,\ldots, X_t]$ $Y_T$

$X_1, \ldots, X_t$ $t$

$t<T$

— гг
источник

X_{i t}

$X_{it}$

Y_{i T}

$Y_{iT}$

{\hat{Y}}_{i t}

$\hat{Y}_{it}$

Y_{i T}

$Y_{iT}$

$\alpha$
$\gamma$ $\gamma=1$

— nsweeney
источник

α

$\alpha$

γ

$\gamma$

α

$\alpha$

γ

$\gamma$