Наука о данных regularization

5

Почему добавление слоя отсева улучшает производительность глубокого / машинного обучения, учитывая, что выпадение подавляет некоторые нейроны из модели?

Если удаление некоторых нейронов приводит к более эффективной модели, почему бы не использовать более простую нейронную сеть с меньшим количеством слоев и меньшим количеством нейронов? Зачем строить большую, более сложную модель в начале, а потом подавлять ее?

13 machine-learning deep-learning keras regularization dropout

2

Зачем использовать регуляризацию L1 над L2?

При проведении модели линейной регрессии с использованием функции потерь, почему я должен использовать вместо регуляризации ?L 2L1L1L_1L2L2L_2 Это лучше для предотвращения переоснащения? Является ли это детерминированным (поэтому всегда уникальным решением)? Это лучше при выборе функции (потому что производство разреженных моделей)? Распределяет ли он весовые характеристики между функциями?

10 linear-regression regularization

3

Выбор метода регуляризации в нейронных сетях

При обучении нейронных сетей существует как минимум 4 способа упорядочения сети: Регуляризация L1 Регуляризация L2 Выбывать Пакетная нормализация плюс, конечно, другие вещи, такие как распределение веса и уменьшение количества соединений, что не может быть регуляризацией в самом строгом смысле. Но как выбрать, какой из этих методов регуляризации использовать? Есть ли …

9 neural-network regularization

2

Существуют ли исследования, которые изучают отсев против других регуляризаций?

Существуют ли опубликованные статьи, в которых показаны различия в методах регуляризации для нейронных сетей, предпочтительно в разных областях (или, по крайней мере, в разных наборах данных)? Я спрашиваю, потому что у меня сейчас есть ощущение, что большинство людей, похоже, используют только отсев для регуляризации в компьютерном зрении. Я хотел бы …

9 neural-network computer-vision convnet regularization dropout

Вопросы с тегом «regularization»