Вопросы с тегом «pandas»

Pandas - это библиотека Python для манипулирования и анализа данных, например, фреймов данных, многомерных временных рядов и наборов данных поперечного сечения, обычно встречающихся в статистике, результатах экспериментальной науки, эконометрике или финансах. Pandas - одна из основных библиотек данных в Python.

11
Как разбить список внутри ячейки Dataframe на отдельные строки
Я хочу превратить ячейку pandas, содержащую список, в строки для каждого из этих значений. Итак, возьмите это: Если я хочу распаковать и сложить значения в nearest_neighborsстолбце, чтобы каждое значение было строкой в ​​каждом opponentиндексе, как мне лучше всего это сделать? Существуют ли методы pandas, предназначенные для подобных операций?

6
Получение вертикальных линий сетки для отображения на линейном графике в matplotlib
Я хочу, чтобы на моем графике отображались как горизонтальные, так и вертикальные линии сетки, но по умолчанию отображаются только горизонтальные линии сетки. Я использую pandas.DataFrameзапрос sql в python для создания линейного графика с датами на оси x. Я не уверен, почему они не появляются в датах, и я пытался найти …

5
Добавление меток значений на гистограмму matplotlib
Я застрял на чем-то, что должно быть относительно легким. Код, который я привожу ниже, представляет собой образец, основанный на более крупном проекте, над которым я работаю. Я не видел причин публиковать все подробности, поэтому, пожалуйста, примите структуры данных, которые я привожу, как есть. По сути, я создаю гистограмму и просто …

3
Общее количество панд различно
Допустим, у меня есть журнал активности пользователей, и я хочу создать отчет с общей продолжительностью и количеством уникальных пользователей за день. import numpy as np import pandas as pd df = pd.DataFrame({'date': ['2013-04-01','2013-04-01','2013-04-01','2013-04-02', '2013-04-02'], 'user_id': ['0001', '0001', '0002', '0002', '0002'], 'duration': [30, 15, 20, 15, 30]}) Агрегировать продолжительность довольно просто: …
95 python  pandas 


6
Как повернуть метки деления оси X в столбчатой ​​диаграмме Pandas
Со следующим кодом: import matplotlib matplotlib.style.use('ggplot') import matplotlib.pyplot as plt import pandas as pd df = pd.DataFrame({ 'celltype':["foo","bar","qux","woz"], 's1':[5,9,1,7], 's2':[12,90,13,87]}) df = df[["celltype","s1","s2"]] df.set_index(["celltype"],inplace=True) df.plot(kind='bar',alpha=0.75) plt.xlabel("") Я сделал такой сюжет: Как я могу повернуть метки деления оси x на 0 градусов? Я попытался добавить это, но не сработало: plt.set_xticklabels(df.index,rotation=90)

10
Удаление нескольких столбцов на основе имен столбцов в Pandas
У меня есть некоторые данные, и когда я их импортирую, я получаю следующие ненужные столбцы. Я ищу простой способ удалить все эти 'Unnamed: 24', 'Unnamed: 25', 'Unnamed: 26', 'Unnamed: 27', 'Unnamed: 28', 'Unnamed: 29', 'Unnamed: 30', 'Unnamed: 31', 'Unnamed: 32', 'Unnamed: 33', 'Unnamed: 34', 'Unnamed: 35', 'Unnamed: 36', 'Unnamed: 37', …
94 python  pandas 

6
Как передать еще один столбец целиком в качестве аргумента в pandas fillna ()
Я хотел бы заполнить недостающие значения в одном столбце значениями из другого столбца, используя fillnaметод. (Я читал, что перебирать каждую строку было бы очень плохой практикой и что было бы лучше делать все за один раз, но я не мог понять, как это сделать fillna.) Данные до: Day Cat1 Cat2 …
94 python  pandas  fillna 

7
Панды Как отфильтровать серию
У меня есть такая серия после выполнения groupby ('name') и использования функции mean () в другом столбце name 383 3.000000 663 1.000000 726 1.000000 737 9.000000 833 8.166667 Может ли кто-нибудь показать мне, как отфильтровать строки со средними значениями 1 000 000? Спасибо, и я очень ценю вашу помощь.
94 python  pandas 

5
Построение категориальных данных с помощью pandas и matplotlib
У меня есть фрейм данных с категориальными данными: colour direction 1 red up 2 blue up 3 green down 4 red left 5 red right 6 yellow down 7 blue down Я хочу создать несколько графиков, например круговых диаграмм и гистограмм, на основе категорий. Возможно ли это без создания фиктивных …
94 python  pandas 

6
Есть ли способ в Pandas использовать предыдущее значение строки в dataframe.apply, когда предыдущее значение также вычисляется в приложении?
У меня есть следующий фреймворк: Index_Date A B C D =============================== 2015-01-31 10 10 Nan 10 2015-02-01 2 3 Nan 22 2015-02-02 10 60 Nan 280 2015-02-03 10 100 Nan 250 Требовать: Index_Date A B C D =============================== 2015-01-31 10 10 10 10 2015-02-01 2 3 23 22 2015-02-02 10 …

6
Большой постоянный DataFrame в пандах
Я изучаю возможность перехода на python и pandas как давний пользователь SAS. Однако при выполнении некоторых тестов сегодня я был удивлен, что python исчерпал память при попытке pandas.read_csv()создать csv-файл размером 128 МБ. В нем было около 200 000 строк и 200 столбцов, в основном числовых данных. С помощью SAS я …
93 python  pandas  sas 

1
Python Pandas: как читать только первые n строк файлов CSV?
У меня очень большой набор данных, и я не могу позволить себе прочитать весь набор данных. Итак, я думаю прочитать только один его фрагмент для обучения, но я не знаю, как это сделать. Любая мысль будет оценена по достоинству.
93 python  pandas  csv  file-io 

4
Сортировка фреймов данных Pandas по дате
У меня есть фреймворк pandas следующим образом: Symbol Date A 02/20/2015 A 01/15/2016 A 08/21/2015 Я хочу отсортировать его Date, но столбец - это просто object. Я попытался сделать столбец объектом даты, но столкнулся с проблемой, когда этот формат не является нужным. Нужен формат 2015-02-20,и т. Д. Итак, теперь я …
93 python  pandas 

5
Постройте разные DataFrames на одном рисунке
У меня есть файл температуры с многолетними записями температуры в следующем формате: 2012-04-12,16:13:09,20.6 2012-04-12,17:13:09,20.9 2012-04-12,18:13:09,20.6 2007-05-12,19:13:09,5.4 2007-05-12,20:13:09,20.6 2007-05-12,20:13:09,20.6 2005-08-11,11:13:09,20.6 2005-08-11,11:13:09,17.5 2005-08-13,07:13:09,20.6 2006-04-13,01:13:09,20.6 Каждый год имеет разные числа, время записи, поэтому pandas datetimeindices все разные. Я хочу изобразить данные за разные годы на одном и том же рисунке для сравнения. Ось …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.