Допустим, у меня есть классификатор логистической регрессии. В обычном пакетном обучении я бы использовал термин регуляризатор, чтобы предотвратить переоснащение и сохранить вес небольшим. Я также нормализую и масштабирую свои функции.
В режиме онлайн обучения я получаю непрерывный поток данных. Я делаю обновление градиентного спуска с каждым примером и затем отбрасываю его. Должен ли я использовать понятие масштабирования и регуляризации в онлайн-обучении? Если да, как я могу это сделать? Например, у меня нет набора обучающих данных для сравнения. У меня также нет проверки для настройки параметра регуляризации. Если нет, то почему нет?
В своем онлайн-обучении я постоянно получаю поток примеров. Для каждого нового примера я делаю прогноз. Затем на следующем шаге времени я получаю фактическую цель и выполняю обновление градиентного спуска.