Представьте, вы врач в отделении интенсивной терапии. У вас есть пациент с сильной лихорадкой и определенным количеством клеток крови, с заданным весом тела и сотней различных данных, и вы хотите предсказать, выживет ли он или она. Если да, он собирается скрыть эту историю о своем другом ребенке своей жене, если нет, ему важно раскрыть ее, пока он может.
Врач может сделать этот прогноз, основываясь на данных бывших пациентов, которые он имел в своем отделении. Основываясь на своих знаниях программного обеспечения, он может прогнозировать, используя обобщенную линейную регрессию (glm) или через нейронную сеть (nn).
1. Обобщенная линейная модель
Существует много взаимосвязанных параметров для glm, поэтому, чтобы получить результат, врач должен будет сделать предположения (линейность и т. Д.) И решения о том, какие параметры могут оказать влияние. GLM вознаградит его t-тестом значимости для каждого из его параметров, чтобы он мог собрать убедительные доказательства того, что пол и лихорадка оказывают значительное влияние, а вес тела не обязательно так.
2. Нейронная сеть
Нейронная сеть проглотит и переварит всю информацию, которая есть в выборке бывших пациентов. Это не будет заботиться о том, коррелируют ли предикторы, и не будет раскрывать так много информации о том, кажется ли влияние массы тела важным только в имеющейся выборке или в целом (по крайней мере, не на уровне опыта, который врач может предложить). Это просто вычислит результат.
Что лучше
Какой метод выбрать, зависит от того, с какой точки зрения вы смотрите на проблему: как пациент, я бы предпочел нейронную сеть, которая использует все доступные данные для лучшего предположения о том, что произойдет со мной без сильных и явно ошибочных предположений, таких как линейность. Как врач, который хочет представить некоторые данные в журнале, ему нужны p-значения. Медицина очень консервативна: они будут просить р-значения. Поэтому врач хочет сообщить, что в такой ситуации пол оказывает существенное влияние. Для пациента это не имеет значения, просто используйте любое влияние, которое образец может быть наиболее вероятным.
В этом примере пациент хочет предсказания, ученая сторона доктора хочет умозаключения. Главным образом, когда вы хотите понять систему, тогда вывод это хорошо. Если вам нужно принять решение, когда вы не можете понять систему, прогнозирования будет достаточно.