Вопросы с тегом «pandas»

Pandas - это библиотека Python для манипулирования и анализа данных, например, фреймов данных, многомерных временных рядов и наборов данных поперечного сечения, обычно встречающихся в статистике, результатах экспериментальной науки, эконометрике или финансах. Pandas - одна из основных библиотек данных в Python.

6
Как динамически обновлять график в цикле в записной книжке Ipython (в пределах одной ячейки)
Среда: Python 2.7, matplotlib 1.3, IPython notebook 1.1, linux, chrome. Код находится в одной ячейке ввода, используя--pylab=inline Я хочу использовать блокнот IPython и pandas для использования потока и динамического обновления графика каждые 5 секунд. Когда я просто использую оператор печати для печати данных в текстовом формате, он работает отлично: выходная …


2
Предупреждение пользователя Python Pandas: сортировка, поскольку ось без объединения не выровнена
Я делаю некоторую практику кода и применяю слияние фреймов данных при этом, получая предупреждение пользователя /usr/lib64/python2.7/site-packages/pandas/core/frame.py:6201: FutureWarning: Сортировка, поскольку ось без конкатенации не выровнена. В будущей версии pandas по умолчанию будет отключена сортировка. Чтобы принять будущее поведение, передайте sort = True. Чтобы сохранить текущее поведение и отключить предупреждение, передайте sort …
93 python  pandas 

6
Pandas groupby кумулятивная сумма
Я хотел бы добавить столбец совокупной суммы в мой фрейм данных Pandas, чтобы: name | day | no -----|-----------|---- Jack | Monday | 10 Jack | Tuesday | 20 Jack | Tuesday | 10 Jack | Wednesday | 50 Jill | Monday | 40 Jill | Wednesday | 110 становится: …
93 python  pandas 

4
Pandas Merge - Как избежать дублирования столбцов
Я пытаюсь объединить два фрейма данных. Каждый фрейм данных имеет два уровня индекса (дата, cusip). В столбцах некоторые столбцы совпадают между двумя (например, валюта, дата корректировки). Как лучше всего объединить их по индексу, но не брать две копии валюты и даты корректировки. Каждый фрейм данных состоит из 90 столбцов, поэтому …
93 python  pandas 

3
Python: получить счетчик частоты на основе двух столбцов (переменных) в кадре данных pandas в некоторых приложениях строк
Здравствуйте, у меня есть следующий фрейм данных. Group Size Short Small Short Small Moderate Medium Moderate Small Tall Large Я хочу подсчитать, сколько раз одна и та же строка появляется в кадре данных. Group Size Time Short Small 2 Moderate Medium 1 Moderate Small 1 Tall Large 1

5
Преобразование Django QuerySet в pandas DataFrame
Я собираюсь преобразовать Django QuerySet в pandas DataFrameследующим образом: qs = SomeModel.objects.select_related().filter(date__year=2012) q = qs.values('date', 'OtherField') df = pd.DataFrame.from_records(q) Это работает, но есть ли более эффективный способ?
93 python  django  pandas 

6
Преобразование серии pandas в DataFrame
У меня есть серия Pandas sf: email email1@email.com [1.0, 0.0, 0.0] email2@email.com [2.0, 0.0, 0.0] email3@email.com [1.0, 0.0, 0.0] email4@email.com [4.0, 0.0, 0.0] email5@email.com [1.0, 0.0, 3.0] email6@email.com [1.0, 5.0, 0.0] И я хотел бы преобразовать его в следующий DataFrame: index | email | list _____________________________________________ 0 | email1@email.com | …

11
Разделение фрейма данных на несколько фреймов данных
У меня очень большой фрейм данных (около 1 миллиона строк) с данными эксперимента (60 респондентов). Я хотел бы разбить фрейм данных на 60 фреймов данных (фрейм данных для каждого участника). В кадре данных dataесть переменная с именем 'name', которая является уникальным кодом для каждого участника. Я пробовал следующее, но ничего …

2
Pandas Groupby Диапазон ценностей
Есть ли в пандах простой метод для вызова groupbyдиапазона приращений значений? Например, в приведенном ниже примере я могу разбить и сгруппировать столбец Bс 0.155приращением, чтобы, например, первая пара групп в столбце была Bразделена на диапазоны между '0 - 0,155, 0,155 - 0,31 ... import numpy as np import pandas as …

4
Python pandas: сохранить выбранный столбец как DataFrame вместо Series
При выборе одного столбца из фрейма данных pandas (скажем df.iloc[:, 0], df['A']или df.Aи т. Д.) Результирующий вектор автоматически преобразуется в серию, а не в фрейм данных с одним столбцом. Однако я пишу некоторые функции, которые принимают DataFrame в качестве входного аргумента. Поэтому я предпочитаю иметь дело с DataFrame с одним …
92 python  pandas 

4
Загрузка файла с более чем одной строкой JSON в Pandas
Я пытаюсь прочитать файл JSON в кадре данных Python pandas (0.14.0). Вот первая строка файла JSON: {"votes": {"funny": 0, "useful": 0, "cool": 0}, "user_id": "P_Mk0ygOilLJo4_WEvabAA", "review_id": "OeT5kgUOe3vcN7H6ImVmZQ", "stars": 3, "date": "2005-08-26", "text": "This is a pretty typical cafe. The sandwiches and wraps are good but a little overpriced and the …

4
Объедините строки из нескольких строк с помощью Pandas groupby
Я хочу объединить несколько строк в фрейм данных на основе groupedby в Pandas. Это мой код: import pandas as pd from io import StringIO data = StringIO(""" "name1","hej","2014-11-01" "name1","du","2014-11-02" "name1","aj","2014-12-01" "name1","oj","2014-12-02" "name2","fin","2014-11-01" "name2","katt","2014-11-02" "name2","mycket","2014-12-01" "name2","lite","2014-12-01" """) # load string as stream into dataframe df = pd.read_csv(data,header=0, names=["name","text","date"],parse_dates=[2]) # add column …

4
Какие плюсы и минусы между get_dummies (Pandas) и OneHotEncoder (Scikit-learn)?
Я изучаю различные методы преобразования категориальных переменных в числовые для классификаторов машинного обучения. Я наткнулся на pd.get_dummiesметод и sklearn.preprocessing.OneHotEncoder()хотел посмотреть, чем они отличаются по производительности и использованию. Я нашел руководство по использованию OneHotEncoder()на https://xgdgsc.wordpress.com/2015/03/20/note-on-using-onehotencoder-in-scikit-learn-to-work-on-categorical-features/, поскольку sklearnдокументация была не слишком полезно на этой функции. У меня такое чувство, что я делаю …

4
группа данных pandas по дате и времени месяц
Рассмотрим файл csv: string,date,number a string,2/5/11 9:16am,1.0 a string,3/5/11 10:44pm,2.0 a string,4/22/11 12:07pm,3.0 a string,4/22/11 12:10pm,4.0 a string,4/29/11 11:59am,1.0 a string,5/2/11 1:41pm,2.0 a string,5/2/11 2:02pm,3.0 a string,5/2/11 2:56pm,4.0 a string,5/2/11 3:00pm,5.0 a string,5/2/14 3:02pm,6.0 a string,5/2/14 3:18pm,7.0 Я могу прочитать это и переформатировать столбец даты в формат datetime: b=pd.read_csv('b.dat') b['date']=pd.to_datetime(b['date'],format='%m/%d/%y …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.