Почему проблемы регрессии называют проблемами «регрессии»?


36

Мне просто интересно, почему проблемы регрессии называют проблемами «регрессии». Какая история стоит за именем?

Одно определение регрессии: «Рецидив в менее совершенное или развитое состояние».


1
См. Второй абзац раздела «История» en.m.wikipedia.org/wiki/Regression_analysis
Марк Уайт

Ответы:


34

Термин «регресс» был использован Фрэнсисом Гальтоном в его работе 1886 года «Регрессия к посредственности в наследственном статусе». Насколько мне известно, он использовал этот термин только в контексте регрессии к среднему . Затем этот термин был принят другими, чтобы получить более или менее то значение, которое он имеет сегодня как общий статистический метод.


15
Гальтон вывел линейное приближение, чтобы оценить рост сына по росту отца в этой статье. Его уравнение было подобрано так, чтобы у отца среднего роста был сын среднего роста, но у отца выше среднего был бы сын, который был на 2/3 выше среднего, чем его отец. То же самое с короче, чем в среднем. Можно утверждать, что это простая линейная регрессия (сегодняшнее значение). И, конечно, сегодня регрессия имеет еще более широкое значение: это любая модель, которая делает непрерывные прогнозы. Интересно, насколько сильно изменилось его первоначальное использование этого слова.
rm999

3
Ответ NRH правильный. Следующая ссылка дает гораздо больше подробностей о работе Фрэнсиса Гальтона «Регрессия к посредственности в наследственном статусе» blog.minitab.com/blog/statistics-and-quality-data-analysis/…
Гаурав Сингхал

не пора ли статистическому сообществу заменить слово «регрессия» более простым и понятным термином, может быть, «формальным предиктором»?
Авиад Розенхек

4

В отличие от прогресса, мы отступаем к среднему значению, то есть регрессируем. Отсюда и термин регрессия! Я думаю, что-то, что было подобрано и застряло.


2

@Mark White уже упомянул ссылку, но для тех из вас, у кого не так много времени, чтобы проверить ссылку, вот точный ответ:

Происхождение «регрессии»

Термин «регрессия» был придуман Фрэнсисом Гальтоном в 19 веке для описания биологического феномена. Феномен состоял в том, что высоты потомков высоких предков имеют тенденцию регрессировать вниз к нормальному среднему (явление, также известное как регрессия к среднему) (Galton, перепечатано в 1989 году). Для Гальтона регрессия имела только это биологическое значение (Galton, 1887) , но позднее его работа была расширена Удни Йоль и Карлом Пирсоном до более общего статистического контекста (Pearson, 1903).

Ссылки

https://en.wikipedia.org/wiki/Regression_analysis#History

Galton, F. (1877). Типичные законы наследственности. III. Nature, 15 (389), 512-514.

Гальтон Ф. (перепечатано в 1989 г.). Родство и корреляция. Статистическая наука, 4 (2), 80–86.

Пирсон, К. (1903). Закон наследственной наследственности. Биометрика, 2 (2), 211-228.


Регрессия Гальтона как в «регрессии к среднему» имеет смысл. однако я не понимаю использования слова «регрессия» для обозначения «выучить формулу из независимых переменных в переменную результата»
Авиад Розенек

1
В более общем смысле это означает, что машинное обучение использует регрессию, но регрессия не является техникой машинного обучения, несмотря на распространенное ошибочное мнение. Статистическое обучение отделено от машинного обучения, но в целом сторонники ОД используют статистические методы и неправильно маркируют их как ОД, так что появляются очевидные несоответствия. Регрессия Гальтона есть регрессия; это связано с моделированием / прогнозированием тенденции.
LSC

0

«Регрессия» происходит от «регресса», который, в свою очередь, происходит от латинского «регресса» - чтобы вернуться (к чему-то).

В этом смысле регрессия - это метод, который позволяет «вернуться» от грязных, трудно интерпретируемых данных к более четкой и более значимой модели. Как физику, мне нравится эта идея, поскольку физики рассматривают явления природы как множество возможных результатов относительно простого естественного закона.

Другими словами, слово «регрессия», по-видимому, предполагает, что данные - это просто видимый, ощутимый эффект «статистической модели». Другими словами, модель на первом месте, и вы хотите использовать данные, чтобы «вернуться» к тому, что их породило.


0

Как я знаю, слово regressionв статистическом значении - это измерение отношения между средним значением одной переменной и соответствующими значениями других переменных.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.