Есть ли связь между косинусным сходством, корреляцией Пирсона и z-счетом?


16

Мне интересно, есть ли связь между этими тремя показателями. Похоже, я не могу установить связь между ними, ссылаясь на определения (возможно, потому что я новичок в этих определениях и с трудом понимаю их).

Я знаю, что диапазон сходства косинусов может быть от 0 до 1, и что корреляция Пирсона может варьироваться от -1 до 1, и я не уверен в диапазоне z-показателя.

Однако я не знаю, как определенное значение косинусного сходства может рассказать вам что-нибудь о корреляции Пирсона или z-значении, и наоборот?


1
z оценка чего ? z баллы некоторых вещей могут быть связаны с корреляцией Пирсона, Z баллы других вещей не могут. Например, если вы внутренне стандартизируете свои исходные переменные, тогда корреляция Пирсона между x и y является ожидаемым произведением их z-показателей. Или вы можете говорить о z- значениях корреляций Пирсона (корреляции Пирсона минус их ожидания при некоторых условиях, все деленные на стандартную ошибку корреляции Пирсона), которые, безусловно, будут связаны с корреляцией Пирсона.
Glen_b

1
Прямая связь: stats.stackexchange.com/a/22520/3277
ttnphns

Ответы:


29

Косинусное сходство между двумя векторами и Ь просто угол между ними сов θ = бab Во многих приложениях, в которых используется косинусное сходство, векторы неотрицательны (например, термин вектор частоты для документа), и в этом случае косинусное сходство также будет неотрицательным.

cosθ=abab

Для вектора вектор " z- score" обычно определяется как z = x - ˉ xxz где ˉ x =1

z=xx¯sx
иs 2 x = ¯ ( x - ˉ x ) 2 - среднее значение и стандартное отклонениеx. Таким образом,zимеет среднее значение 0 и стандартное отклонение 1, то естьzxявляетсястандартизированнойверсиейx.x¯=1nixisx2=(xx¯)2¯xzzxx

xy

ρx,y=(zxzy)¯

asa2=1na2

a^=aa=zan

ab

n


+1. Комментарий latexnazi: \|часто выглядит лучше ||, и \lVert ... \rVertэто лучший способ написать это.
говорит амеба: восстанови Монику
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.