Вопросы с тегом «pandas-groupby»

Используется для группировки переменных по заданному условию. И только для использования в библиотеке `pandas`

9
Преобразование вывода Pandas GroupBy из Series в DataFrame
Я начинаю с входных данных, как это df1 = pandas.DataFrame( { "Name" : ["Alice", "Bob", "Mallory", "Mallory", "Bob" , "Mallory"] , "City" : ["Seattle", "Seattle", "Portland", "Seattle", "Seattle", "Portland"] } ) Который при печати выглядит так: City Name 0 Seattle Alice 1 Seattle Bob 2 Portland Mallory 3 Seattle Mallory …

7
Получить статистику для каждой группы (например, количество, среднее и т. Д.), Используя pandas GroupBy?
У меня есть фрейм данных, dfи я использую несколько столбцов из него, чтобы groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() Таким образом, я почти получаю таблицу (фрейм данных), которая мне нужна. Чего не хватает, так это дополнительного столбца, который содержит количество строк в каждой группе. Другими словами, я имею в виду, но я также хотел …

2
Как развернуть датафрейм
Что такое пивот? Как мне повернуть? Это стержень? Длинный формат для широкого формата? Я видел много вопросов о сводных таблицах. Даже если они не знают, что спрашивают о сводных таблицах, они обычно так и делают. Практически невозможно написать канонический вопрос и ответ, который охватывает все аспекты поворота .... ... Но …

11
Как сгруппировать строки данных в список в pandas groupby?
У меня есть фрейма данных панд, dfкак: a b A 1 A 2 B 5 B 5 B 4 C 6 Я хочу сгруппировать по первому столбцу и получить второй столбец в виде списков в строках : A [1,2] B [5,5,4] C [6] Можно ли сделать что-то подобное с помощью …

11
Получить ряд (ы), которые имеют максимальное количество в группах, используя групповой
Как найти все строки в кадре данных pandas, которые имеют максимальное значение для countстолбца, после группировки по ['Sp','Mt']столбцам? Пример 1: следующий dataFrame, который я группирую по ['Sp','Mt']: Sp Mt Value count 0 MM1 S1 a **3** 1 MM1 S1 n 2 2 MM1 S3 cb 5 3 MM2 S3 mk …

7
столбцы pandas GroupBy со значениями NaN (отсутствующими)
У меня есть DataFrame со многими пропущенными значениями в столбцах, которые я хочу сгруппировать: import pandas as pd import numpy as np df = pd.DataFrame({'a': ['1', '2', '3'], 'b': ['4', np.NaN, '6']}) In [4]: df.groupby('b').groups Out[4]: {'4': [0], '6': [2]} видите, что Pandas сбросил строки с целевыми значениями NaN. (Я …

5
Как получить доступ к pandas groupby dataframe по ключу
Как получить доступ к соответствующему фрейму данных groupby в объекте groupby по ключу? Со следующей группой: rand = np.random.RandomState(1) df = pd.DataFrame({'A': ['foo', 'bar'] * 3, 'B': rand.randn(6), 'C': rand.randint(0, 20, 6)}) gb = df.groupby(['A']) Я могу пройти через это, чтобы получить ключи и группы: In [11]: for k, gp …

3
Несколько агрегаций одного и того же столбца с использованием pandas GroupBy.agg ()
Есть ли встроенный в pandas способ применения двух разных агрегатных функций f1, f2к одному и тому же столбцу df["returns"]без необходимости вызывать agg()несколько раз? Пример фрейма данных: import pandas as pd import datetime as dt pd.np.random.seed(0) df = pd.DataFrame({ "date" : [dt.date(2012, x, 1) for x in range(1, 11)], "returns" : …

10
GroupBy pandas DataFrame и выберите наиболее распространенное значение
У меня есть фрейм данных с тремя строковыми столбцами. Я знаю, что единственное значение в 3-м столбце действительно для каждой комбинации первых двух. Чтобы очистить данные, мне нужно сгруппировать данные по фреймам по первым двум столбцам и выбрать наиболее распространенное значение третьего столбца для каждой комбинации. Мой код: import pandas …

4
Объедините строки из нескольких строк с помощью Pandas groupby
Я хочу объединить несколько строк в фрейм данных на основе groupedby в Pandas. Это мой код: import pandas as pd from io import StringIO data = StringIO(""" "name1","hej","2014-11-01" "name1","du","2014-11-02" "name1","aj","2014-12-01" "name1","oj","2014-12-02" "name2","fin","2014-11-01" "name2","katt","2014-11-02" "name2","mycket","2014-12-01" "name2","lite","2014-12-01" """) # load string as stream into dataframe df = pd.read_csv(data,header=0, names=["name","text","date"],parse_dates=[2]) # add column …

4
группа данных pandas по дате и времени месяц
Рассмотрим файл csv: string,date,number a string,2/5/11 9:16am,1.0 a string,3/5/11 10:44pm,2.0 a string,4/22/11 12:07pm,3.0 a string,4/22/11 12:10pm,4.0 a string,4/29/11 11:59am,1.0 a string,5/2/11 1:41pm,2.0 a string,5/2/11 2:02pm,3.0 a string,5/2/11 2:56pm,4.0 a string,5/2/11 3:00pm,5.0 a string,5/2/14 3:02pm,6.0 a string,5/2/14 3:18pm,7.0 Я могу прочитать это и переформатировать столбец даты в формат datetime: b=pd.read_csv('b.dat') b['date']=pd.to_datetime(b['date'],format='%m/%d/%y …

9
Панды: заполнение пропущенных значений средним в каждой группе
Это должно быть просто, но самое близкое, что я нашел, это этот пост: pandas: Заполнение недостающих значений внутри группы , и я все еще не могу решить свою проблему .... Предположим, у меня есть следующий фрейм данных df = pd.DataFrame({'value': [1, np.nan, np.nan, 2, 3, 1, 3, np.nan, 3], 'name': …

2
Как мне создать новый столбец из вывода pandas groupby (). Sum ()?
Попытка создать новый столбец из groupbyрасчета. В приведенном ниже коде я получаю правильные рассчитанные значения для каждой даты (см. Группу ниже), но когда я пытаюсь создать с ним новый столбец ( df['Data4']), я получаю NaN. Итак, я пытаюсь создать новый столбец в фрейме данных с суммой Data3для всех дат и …

2
Как найти верхние N минимальных значений из DataFrame, Python-3
У меня ниже Dataframe с полем «Возраст», необходимо найти до 3-х минимальный возраст из DataFrame DF = pd.DataFrame.from_dict({'Name':['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'], 'Age':[18, 45, 35, 70, 23, 24, 50, 65, 18, 23]}) DF['Age'].min() Хотите топ два возраста, то есть 18, 23 в списке, как этого …
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.