У меня есть следующий фреймворк pandas Top15
:
Я создаю столбец, в котором оценивается количество цитируемых документов на человека:
Top15['PopEst'] = Top15['Energy Supply'] / Top15['Energy Supply per Capita']
Top15['Citable docs per Capita'] = Top15['Citable documents'] / Top15['PopEst']
Я хочу знать соотношение между количеством цитируемых документов на душу населения и энергоснабжением на душу населения. Поэтому я использую .corr()
метод (корреляция Пирсона):
data = Top15[['Citable docs per Capita','Energy Supply per Capita']]
correlation = data.corr(method='pearson')
Я хочу вернуть одно число, но результат такой:
.corr
непосредственно к вашему фрейму данных, он вернет все парные корреляции; вот почему вы затем наблюдаете единицы на диагонали вашей матрицы (каждый столбец идеально коррелирует с самим собой). Смотрите мою правку ниже.