Как нормализовать данные между -1 и 1?

Я видел формулу нормализации min-max, но она нормализует значения между 0 и 1. Как бы я нормализовал мои данные между -1 и 1? В моей матрице данных есть как отрицательные, так и положительные значения.

dataset normalization

— covfefe
источник

Если вы работаете в R, посмотрите эту ветку для нескольких вариантов. В частности, комментарий к принятому ответу имеет эту функцию, где вы устанавливаете 'newMax' в 1 и 'newMin' в -1 и запускаете функцию для ваших данных

— mtreg

Вы можете найти ссылку в Википедии следующим образом: en.wikipedia.org/wiki/Normalization_(statistics)

— Салем

Пример Javascript, взятый отсюда . function convertRange (value, r1, r2) {return (value - r1 [0]) * (r2 [1] - r2 [0]) / (r1 [1] - r1 [0]) + r2 [0]; } convertRange (328.17, [300.77, 559.22], [1, 10]); >>> 1.9541497388276272

— Джузеппе Канале

@covfefe, если вы все еще рядом, возможно, вы захотите принять один из ответов

— Simone

Ответы:

{Икс}^{'} знак равно \frac{Икс - мин Икс}{Максимум Икс - мин Икс}

$x' = \frac{x - \min{x}}{\max{x} - \min{x}}$

x

$x$

[0, 1]

$[0,1]$

Для нормализации в вы можете использовать: $[-1,1]$

{Икс}^{"} знак равно 2 \frac{Икс - мин Икс}{Максимум Икс - мин Икс} - 1

$x'' = 2\frac{x - \min{x}}{\max{x} - \min{x}} - 1$

В общем, вы всегда можете получить новую переменную в : $x'''$ $[a,b]$

{Икс}^{'' '} знак равно (б - a) \frac{Икс - мин Икс}{Максимум Икс - мин Икс} + a

$x''' = (b-a)\frac{x - \min{x}}{\max{x} - \min{x}} + a$

— Симона
источник

Честно говоря, у меня нет ссылок на это. Это просто линейное преобразование случайной величины. Посмотрите на влияние линейных преобразований на поддержку случайной величины.

— Симона

-1

Я проверил на случайно сгенерированных данных, и

X_{o u t} = (b - a) \frac{X_{i n} - min X_{i n}}{max X_{i n} - min X_{i n}} + a

$\begin{equation} X_{out} = (b-a)\frac{X_{in} - \min{X_{in}}}{\max{X_{in}} - \min{X_{in}}} + a \end{equation}$

не сохраняет форму распределения. Очень хотелось бы увидеть правильное вывод этого с использованием функций случайных величин.

Подход, который сохранил форму для меня, использовал:

X_{o u t} = \frac{X_{i n} - μ_{i n}}{σ_{i n}} \cdot σ_{o u t} + μ_{o u t}

$\begin{equation} X_{out} = \frac{X_{in} - \mu_{in}}{\sigma_{in}} \cdot \sigma_{out} + \mu_{out} \end{equation}$

где

σ_{o u t} = \frac{b - a}{6}

$\begin{equation} \sigma_{out} = \frac{b-a}{6} \end{equation}$

(Я признаю, что использование 6 немного грязно ) и

μ_{o u t} = \frac{b + a}{2}

$\begin{equation} \mu_{out} = \frac{b+a}{2} \end{equation}$

а также

$a$ и - желаемый диапазон; так что в соответствии с первоначальным вопросом будет и . $b$ $a=-1$ $b=1$

Я пришел к результату из этого рассуждения

Z_{o u t} = Z_{i n}

$\begin{equation} Z_{out} = Z_{in} \end{equation}$

\frac{X_{o u t} - μ_{o u t}}{σ_{o u t}} = \frac{X_{i n} - μ_{i n}}{σ_{i N}}

$\begin{equation} \frac{X_{out} - \mu_{out}}{\sigma_{out}} = \frac{X_{in} - \mu_{in}}{\sigma_{in}} \end{equation}$

— А.Л. Верминбургер
источник

Вы уверены, что это гарантирует, что преобразованные данные будут лежать в границах? В R, попробуйте: set.seed(1); scale(rnorm(1000))*.333. Я получаю максимум 1.230871. Ваш метод, кажется, просто настраивает данные, а не нормализует их по запросу. Обратите внимание, что вопрос не требует метода, который сохраняет форму распределения (что было бы странным требованием для нормализации).

— gung - Восстановить Монику

Я не уверен, как оригинальное преобразование могло не сохранить форму данных. Это эквивалентно вычитанию константы, а затем делению на константу, что и делает ваше предложение, и которое не меняет форму данных. В вашем предложении предполагается, что все данные находятся в пределах трех стандартных отклонений от среднего значения, что может быть несколько разумно для небольших, приблизительно нормально распределенных выборок, но не для больших или ненормальных выборок.

— Ноя

a

$a$

b

$b$

@whuber true, но я имел в виду, что в данном наборе данных (т.е. при обработке данных как фиксированных) они являются константами, так же как среднее значение выборки и функция стандартного отклонения выборки в качестве констант при стандартизации набора данных. У меня сложилось впечатление, что OP хотел нормализовать набор данных, а не распределение.

— Ноя

@ Нет, у меня сложилось такое же впечатление, но я полагаю, что настоящий пост может отвечать на другую интерпретацию.

— whuber