Я пытаюсь понять, как мне лучше всего смоделировать переменную, где со временем я получаю все более детальные предсказатели. Например, рассмотрим моделирование ставок восстановления по просроченным кредитам. Предположим, у нас есть набор данных с данными за 20 лет, и за первые 15 из этих лет мы знаем только, был ли заем обеспечен или нет, но ничего о характеристиках этого обеспечения. Однако за последние пять лет мы можем разбить обеспечение на ряд категорий, которые, как ожидается, будут хорошим предиктором уровня восстановления.
Учитывая эту настройку, я хочу подогнать модель к данным, определить такие показатели, как статистическая значимость предикторов, а затем выполнить прогноз с помощью модели.
В какую отсутствующую структуру данных это вписывается? Существуют ли какие-либо особые соображения, связанные с тем, что более подробные объяснительные переменные становятся доступными только после определенного момента времени, а не разбросаны по исторической выборке?