У меня есть фрейм данных Pandas с несколькими записями, и я хочу рассчитать корреляцию между доходами магазинов определенного типа. Есть ряд магазинов с данными о доходах, классификацией области деятельности (театр, магазины одежды, продукты питания ...) и другими данными.
Я попытался создать новый фрейм данных и вставить столбец с доходами всех видов магазинов, принадлежащих к той же категории, а в возвращаемом фрейме данных заполнен только первый столбец, а в остальных - NaN. Код, который мне надоел:
corr = pd.DataFrame()
for at in activity:
stores.loc[stores['Activity']==at]['income']
Я хочу сделать это, поэтому я могу использовать, .corr()
чтобы дать матрицу корреляции между категориями магазинов.
После этого я хотел бы знать, как я могу построить матричные значения (от -1 до 1, так как я хочу использовать корреляцию Пирсона) с matplolib.