Я начинаю с входных данных, как это
df1 = pandas.DataFrame( {
"Name" : ["Alice", "Bob", "Mallory", "Mallory", "Bob" , "Mallory"] ,
"City" : ["Seattle", "Seattle", "Portland", "Seattle", "Seattle", "Portland"] } )
Который при печати выглядит так:
City Name
0 Seattle Alice
1 Seattle Bob
2 Portland Mallory
3 Seattle Mallory
4 Seattle Bob
5 Portland Mallory
Группировка достаточно проста:
g1 = df1.groupby( [ "Name", "City"] ).count()
и печать дает GroupBy
объект:
City Name
Name City
Alice Seattle 1 1
Bob Seattle 2 2
Mallory Portland 2 2
Seattle 1 1
Но в конечном итоге мне нужен еще один объект DataFrame, который содержит все строки в объекте GroupBy. Другими словами, я хочу получить следующий результат:
City Name
Name City
Alice Seattle 1 1
Bob Seattle 2 2
Mallory Portland 2 2
Mallory Seattle 1 1
Я не совсем понимаю, как это сделать, в документации для панд. Любые намеки приветствуются.
Empty DataFrame
Columns: []
Index: [(Alice, Seattle), (Bob, Seattle), (Mallory, Portland), (Mallory, Seattle)]