Кто-нибудь может объяснить мне реальные различия между регрессионным анализом и подгонкой кривой (линейной и нелинейной), с примером, если это возможно?
Кажется, что оба пытаются найти связь между двумя переменными (зависимыми и независимыми), а затем определяют параметр (или коэффициент), связанный с предлагаемыми моделями. Например, если у меня есть набор данных, таких как:
Y = [1.000 1.000 1.000 0.961 0.884 0.000]
X = [1.000 0.063 0.031 0.012 0.005 0.000]
Кто-нибудь может предложить формулу корреляции между этими двумя переменными? Мне трудно понять разницу между этими двумя подходами. Если вы предпочитаете подкреплять свой ответ другими наборами данных, то все в порядке, поскольку кажется, что этот вариант трудно уместить (возможно, только для меня).
Приведенный выше набор данных представляет оси и y кривой рабочей характеристики приемника (ROC), где y - истинно положительная скорость (TPR), а x - ложно-положительная скорость (FPR).
Я пытаюсь подогнать кривую или выполнить регрессионный анализ в соответствии с моим первоначальным вопросом, пока не уверен, среди этих точек, чтобы оценить TPR для любого конкретного FPR (или наоборот).
Во-первых, является ли научно приемлемым найти такую функцию подгонки кривой между двумя независимыми переменными (TPR и FPR)?
Во-вторых, с научной точки зрения приемлемо найти такую функцию, если я знаю, что распределения фактических отрицательных и фактических положительных случаев не являются нормальными?