Вообразите любую линию регрессии, приспособленную к некоторым данным.
Теперь представьте себе дополнительную точку данных, которая находится на некотором расстоянии от основной части данных, но расположена где-то вдоль этой линии регрессии.
Если бы линия регрессии была переоснащена, коэффициенты не изменились бы. И наоборот, удаление дополнительного выброса будет иметь нулевое влияние на коэффициенты.
Таким образом, выброс или точка влияния могли бы иметь нулевое влияние, если бы они полностью соответствовали остальным данным и модели, которая подразумевает остальные.
Для «линии» читайте «плоскость» или «гиперплоскость», если хотите, но здесь достаточно простейшего примера двух переменных и графика рассеяния.
Однако, так как вы любите определения - часто кажется, что они слишком много читают - вот мое любимое определение выбросов:
«Выбросы представляют собой значения выборки, которые вызывают удивление по отношению к большей части выборки» (WN Venables и BD Ripley. 2002. Современная прикладная статистика с S. New York: Springer, p.119).
Важно отметить, что неожиданность находится в сознании наблюдателя и зависит от какой-то неявной или явной модели данных. Может существовать другая модель, при которой выброс не удивителен, например, если данные действительно являются логнормальными или гамма, а не нормальными.
PS Я не думаю, что в точках кредитного плеча обязательно отсутствуют соседние наблюдения. Например, они могут встречаться парами.