В последнее время я пытался узнать больше об онлайн-обучении (это абсолютно увлекательно!), И одна тема, которую я так и не смог понять, - как думать о выборе моделей в офлайновом и онлайн-контекстах. В частности, предположим , что мы тренируем классификатор в автономном режиме, на основе некоторого фиксированного набора данных D . Скажем, мы оцениваем его рабочие характеристики с помощью перекрестной проверки и выбираем лучший классификатор таким образом.
Это то, о чем я думал: как же тогда применить приложение к онлайн-настройке? Можем ли мы предположить, что лучший S, найденный в автономном режиме, также будет работать как онлайн-классификатор? Имеет ли смысл собирать некоторые данные для обучения S , затем брать тот же классификатор S и «оперативно» использовать его в режиме онлайн с теми же параметрами, что и в D , или другой подход может быть лучше? Какие предостережения в этих случаях? Каковы основные результаты здесь? И так далее.
Во всяком случае, теперь, когда это там, я думаю, что я ищу некоторые ссылки или ресурсы, которые помогут мне (и, надеюсь, другим, которые думали об этой вещи!) Сделать переход от мышления исключительно в автономном режиме, и развить умственную структуру, чтобы думать о проблеме выбора модели и этих вопросах более согласованно в процессе моего чтения.