На работе мы обсуждали это, так как мой начальник никогда не слышал о нормализации. В линейной алгебре нормализация, по-видимому, относится к делению вектора на его длину. И в статистике стандартизация, по-видимому, относится к вычитанию среднего значения, которое затем делится на его SD. Но они кажутся взаимозаменяемыми и с другими возможностями.
При создании какой-то универсальной оценки, которая составляет разных показателя, которые имеют разные средние значения и разные SD, вы бы нормализовали, стандартизировали или что-то еще? Один человек сказал мне, что нужно просто взять каждую метрику и разделить их по их SD, индивидуально. Затем суммируем два. И это приведет к универсальной оценке, которая может быть использована для оценки обеих метрик.
Например, скажем, у вас было количество людей, которые едут на метро на работу (в Нью-Йорке) и количество людей, которые ездили на работу (в Нью-Йорке).
автомобилей ⟶ у
Любая статья или главы книг для справки будет принята с благодарностью. СПАСИБО!
Также вот еще один пример того, что я пытаюсь сделать.
Представьте, что вы декан колледжа и обсуждаете требования для поступления. Возможно, вы захотите, чтобы студенты имели по крайней мере определенный средний балл и определенный тестовый балл. Было бы хорошо, если бы они оба были в одном масштабе, потому что тогда вы можете просто сложить их вместе и сказать: «Любой, у кого есть хотя бы 7.0, может быть допущен». Таким образом, если у будущего студента будет средний балл 4,0, он может набрать всего 3,0 балла и все равно получить допуск. И наоборот, если у кого-то был средний балл 3,0, он все равно мог получить допуск с оценкой 4,0.
Но это не так. ACT по 36-балльной шкале, и большинство GPA на 4.0 (некоторые 4.3, да, раздражает). Поскольку я не могу просто добавить ACT и GPA, чтобы получить какой-то универсальный балл, как я могу преобразовать их, чтобы их можно было добавить, создавая таким образом универсальный балл при поступлении. И тогда, как декан, я мог просто автоматически принять кого-либо с оценкой выше определенного порога. Или даже автоматически принимать всех, чей счет находится в верхних 95% ... такого рода вещи.
Будет ли это нормализацией? стандартизация? или просто делим каждый на их SD и затем суммируем?