Как объяснить разницу между логистической регрессией и нейронной сетью для аудитории, не имеющей опыта в статистике?
Как объяснить разницу между логистической регрессией и нейронной сетью для аудитории, не имеющей опыта в статистике?
Ответы:
Я предполагаю, что вы думаете о том, что было раньше, и, возможно, все еще упоминается как «многослойные персептроны» в вашем вопросе о нейронных сетях. Если это так, то я бы все объяснил с точки зрения гибкости в отношении формы границы решения как функции объясняющих переменных. В частности, для этой аудитории я бы не упомянул функции ссылок / коэффициенты входа и т. Д. Просто придерживайтесь идеи, что вероятность события прогнозируется на основе некоторых наблюдений.
Вот возможная последовательность:
Преимущества этого подхода в том, что вам не нужно вдаваться в какие-либо математические подробности, чтобы дать правильное представление. На самом деле им не нужно понимать ни логистическую регрессию, ни нейронные сети, чтобы понять сходства и различия.
Недостаток подхода заключается в том, что вам приходится делать много картинок и сильно сопротивляться искушению спуститься в алгебру, чтобы что-то объяснить.
Для более простого резюме:
Логистическая регрессия: простейшая форма нейронной сети, которая приводит к тому, что границы принятия решений являются прямой линией
Нейронные сети: надмножество, которое включает в себя логистическую регрессию, а также другие классификаторы, которые могут генерировать более сложные границы принятия решений.
(примечание: я имею в виду «простую» логистическую регрессию, без помощи интегральных ядер)
(ссылка: курсы Deeplearning.ai Эндрю Нг, «Логистическая регрессия как нейронная сеть» и «Классификация плоских данных с одним скрытым слоем»)
Я собираюсь взять вопрос буквально: кто-то без опыта в статистике. И я не собираюсь пытаться дать этому человеку знания в области статистики. Например, предположим, вы должны объяснить разницу генеральному директору компании или что-то в этом роде.
Итак: Логистическая регрессия - это инструмент для моделирования категориальной переменной в терминах других переменных. Это дает вам возможность узнать, как изменения в каждой из «других» переменных влияют на шансы разных результатов в первой переменной. Вывод довольно легко интерпретировать.
Нейронные сети - это набор методов, позволяющих компьютеру учиться на примерах, которые смутно напоминают то, как люди узнают о вещах. Это может привести к появлению моделей, которые являются хорошими предикторами, но обычно они гораздо более непрозрачны, чем модели логистической регрессии.
Меня учили, что вы можете думать о нейронных сетях (с функциями логистической активации) как о средневзвешенном значении логит-функций с оценкой самих весов. Выбирая большое количество логитов, вы можете уместить любую функциональную форму. В блоге Econometric Sense есть некоторая графическая интуиция .
Другие ответы великолепны. Я бы просто добавил несколько картинок, показывающих, что вы можете рассматривать логистическую регрессию и мультиклассовую логистическую регрессию (она же максимальная, многочленная логистическая регрессия, регрессия softmax, классификатор максимальной энтропии) как особую архитектуру нейронных сетей.
От Себастьяна Рашки, Мичиганского государственного университета, на KDnuggets :
Еще несколько иллюстраций для мультиклассовой логистической регрессии:
Аналогичная иллюстрация взята с http://www.deeplearningbook.org/ глава 1:
И еще один из учебников TensorFlow :
Например, в Caffe вы бы осуществили логистическую регрессию следующим образом :
Я бы использовал пример сложной, но конкретной проблемы, которую понимает аудитория. Используйте скрытые узлы, интерпретации которых не обучены, но имеют определенные значения.
Линейная регрессия определяет, насколько хорошо иметь белого коня на h4. Это может быть неочевидно, что это вообще хорошо, но если он на h4, он не был захвачен, что, вероятно, перевешивает другие соображения. Линейная регрессия, вероятно, восстанавливает грубые значения фигур, и что лучше, чтобы ваши фигуры были ближе к центру доски и на стороне противника. Линейная регрессия не может оценить комбинации, например, ваша ферзь на b2 внезапно становится более ценной, если противоборствующий король на a1.
Нейронная сеть может иметь скрытые узлы для таких понятий, как «материальное преимущество», «безопасность черного короля», «контроль над центром», «обе ладьи в d-файле», «изолированная пешка королевской ладьи» или «слон». мобильность «. Некоторые из них могут быть оценены только из входов платы, в то время как другие, возможно, должны быть во втором или более позднем скрытом слое. Нейронная сеть может использовать их в качестве входных данных для окончательной оценки позиции. Эти понятия помогают эксперту оценить позицию, поэтому нейронная сеть должна быть способна к более точным оценкам, чем линейная регрессия. Однако для создания нейронной сети требуется больше усилий, так как вам нужно выбрать ее структуру, и у нее гораздо больше параметров для обучения.