Являются ли данные «отсутствующими» в смысле того, что они неизвестны, или это просто означает, что кредит отсутствует (таким образом, сумма кредита равна нулю)? Похоже на последнее, в этом случае вам нужен дополнительный двоичный манекен, чтобы указать, есть ли кредит. Преобразование суммы кредита не требуется (кроме, возможно, непрерывного повторного выражения, такого как корневой или запущенный журнал, что может быть указано в силу других соображений).
Это хорошо работает в регрессии. Простой пример - концептуальная модель формы
зависимая переменная (Y) = сумма кредита (X) + константа.
С добавлением индикатора ссуды ( ) регрессионная моделья
Y= βяя+ βИксИкс+ β0+ ϵ
с представляет случайные ошибки с нулевыми ожиданиями. Коэффициенты интерпретируются как:ε
- это ожидание Y для ситуаций без займа, потому что они характеризуются X = 0 и I = 0 .β0YИкс= 0я= 0
- это предельное изменение Y по отношению к сумме кредита ( X ).βИксYИкс
- это перехват для случаев с кредитами.βя+ β0