Я не знаю, имеете ли вы в виду именно это, но я вижу, что многие люди ссылаются на нормализацию, что означает стандартизацию данных. Стандартизация преобразует ваши данные, поэтому они имеют среднее значение 0 и стандартное отклонение 1:
x <- (x - mean(x)) / sd(x)
Я также вижу людей, использующих термин нормализация для масштабирования данных, как при преобразовании ваших данных в диапазон 0-1:
x <- (x - min(x)) / (max(x) - min(x))
Это может сбить с толку!
Оба метода имеют свои плюсы и минусы. При масштабировании набора данных со слишком большим количеством выбросов ваши не-выбросные данные могут оказаться в очень небольшом интервале. Поэтому, если в вашем наборе данных слишком много выбросов, вы можете рассмотреть возможность его стандартизации. Тем не менее, когда вы это сделаете, у вас получатся отрицательные данные (иногда вы этого не хотите) и неограниченные данные (вы, возможно, тоже этого не захотите).