Контекст:
Из вопроса об обмене стеками по математике (могу ли я построить программу) кто-то имеет набор точек и хочет подогнать к нему кривую, линейную, экспоненциальную или логарифмическую. Обычный метод состоит в том, чтобы начать с выбора одного из них (который определяет модель), а затем выполнить статистические вычисления.
Но что действительно нужно, так это найти «лучшую» кривую из линейной, экспоненциальной или логарифмической.
Якобы, можно попробовать все три и выбрать наиболее подходящую кривую из трех в соответствии с наилучшим коэффициентом корреляции.
Но почему-то я чувствую, что это не совсем кошерно. Общепринятый метод - сначала выбрать модель, одну из этих трех (или какую-либо другую функцию связи), а затем по данным рассчитать коэффициенты. И постфактум сбор лучших - это сбор вишни. Но для меня, независимо от того, определяете ли вы функцию или коэффициенты по данным, это все равно, ваша процедура обнаруживает лучшее ... (скажем, что эта функция - еще один коэффициент, который можно обнаружить).
Вопросов:
- Уместно ли выбирать модель наилучшего соответствия из линейных, экспоненциальных и логарифмических моделей на основе сравнения статистики соответствия?
- Если это так, то какой самый подходящий способ сделать это?
- Если регрессия помогает найти параметры (коэффициенты) в функции, почему не может быть дискретного параметра, чтобы выбрать, из какого семейства кривых получилось бы лучшее?