К сожалению, термины по-разному используются в разных областях, разными людьми в одной и той же области и т. Д., Поэтому я не уверен, насколько хорошо это можно ответить здесь для вас. Вы должны убедиться, что вы знаете определение, которое ваш инструктор / учебник использует для «нормализованного». Тем не менее, вот некоторые общие определения:
По центру:
Стандартизировано: X - среднее
X−mean
нормализовано:X-мин(X)X−meansd
Нормализацияв этом смысле изменяет ваши данные в единичный интервал.
Стандартизацияпревращает ваши данные в
z-показатели, как отмечает @Jeff. А
центрированиепросто делает среднее ваших данных равным
0.
X−min(X)max(X)−min(X)
z0
Здесь стоит признать, что все три из них являются линейными преобразованиями ; как таковые, они не меняют форму вашего дистрибутива . То есть иногда люди называют преобразование score «нормализующим» и считают, что из -за ассоциации z- scores с нормальным распределением это делало их данные нормально распределенными. Это не так (как замечает @Jeff, и как вы могли бы сказать, нанося на график ваши данные до и после). Если вам интересно, вы можете изменить форму своих данных, например, с помощью семейства преобразований Box-Cox . zz
Что касается того, как вы могли бы проверить эти преобразования, это зависит от того, что именно подразумевается под этим. Если они имеют в виду просто проверить, что код работает правильно, вы можете проверить средства, SD, минимумы и максимумы.