В настоящее время я учу себя, как делать классификацию, и, в частности, я смотрю на три метода: опорные векторные машины, нейронные сети и логистическая регрессия. Я пытаюсь понять, почему логистическая регрессия будет лучше, чем две другие.
Исходя из моего понимания логистической регрессии, идея состоит в том, чтобы подогнать логистическую функцию ко всем данным. Поэтому, если мои данные являются двоичными, все мои данные с меткой 0 должны быть сопоставлены со значением 0 (или близко к нему), а все мои данные со значением 1 должны быть сопоставлены со значением 1 (или близко к нему). Теперь, поскольку логистическая функция является непрерывной и гладкой, выполнение этой регрессии требует, чтобы все мои данные соответствовали кривой; больше нет значения, применяемого к точкам данных вблизи границы принятия решения, и все точки данных вносят вклад в потерю в разной степени.
Однако с помощью машин опорных векторов и нейронных сетей важны только те точки данных, которые находятся вблизи границы принятия решения; до тех пор, пока точка данных остается на той же стороне границы решения, она будет вносить такую же потерю.
Поэтому, почему бы логистической регрессии когда-либо превосходить опорные векторные машины или нейронные сети, учитывая, что она «тратит впустую ресурсы» при попытке подогнать кривую к большому количеству неважных (легко классифицируемых) данных, вместо того, чтобы фокусироваться только на сложных данных при принятии решения? граница?