Вы можете проверить эту ссылку . Sci-kit learn реализует рандомизированную логистическую регрессию, и метод описан там.
Но чтобы ответить на ваш вопрос, эти два метода в значительной степени различаются по своим целям. Логистическая регрессия заключается в подборе модели, а RLR - в поиске переменных, которые входят в модель.
Ванильная логистическая регрессия является обобщенной линейной моделью. Для бинарного ответа мы полагаем, что логарифмические вероятности ответа являются линейной функцией от числа предикторов. Коэффициенты предикторов оцениваются с использованием максимальной вероятности, а затем вывод о параметрах основывается на свойствах большой выборки модели. Для достижения наилучших результатов мы обычно предполагаем, что модель достаточно проста и понятна. Мы знаем, какие независимые переменные влияют на ответ. Мы хотим оценить параметры модели.
Конечно, на практике мы не всегда знаем, какие переменные должны быть включены в модель. Это особенно верно в ситуациях машинного обучения, где число потенциальных объясняющих переменных огромно, а их значения редки.
На протяжении многих лет многие люди пытались использовать методы подбора статистической модели с целью выбора переменных (читай «особенность»). При повышении уровня надежности:
- Подберите большую модель и отбросьте переменные с незначительной статистикой Вальда. Не всегда производит лучшую модель.
- Посмотрите на все возможные модели и выберите «лучшие». Вычислительно интенсивный и не надежный.
- Установите большую модель с штрафным сроком L1 (стиль лассо). Бесполезные переменные сбрасываются в соответствии. Лучше, но нестабильно с разреженными матрицами.
- Метод рандомизации 3. Возьмите случайные подмножества, подберите для каждого из них штрафную модель и сопоставьте результаты. Переменные, которые часто появляются, выбираются. Когда ответ является двоичным, это рандомизированная логистическая регрессия. Подобную технику можно использовать с непрерывными данными и общей линейной моделью.