Вопросы с тегом «pandas»

Pandas - это библиотека Python для манипулирования и анализа данных, например, фреймов данных, многомерных временных рядов и наборов данных поперечного сечения, обычно встречающихся в статистике, результатах экспериментальной науки, эконометрике или финансах. Pandas - одна из основных библиотек данных в Python.

14
Панды: фильтровать строки DataFrame с оператором цепочки
Большинство операций в pandasможет быть выполнены с помощью оператора цепочки ( groupby, aggregate, apply, и т.д.), но единственным способом я нашел для фильтра строк с помощью обычной индексации кронштейна df_filtered = df[df['column'] == value] Это непривлекательно, так как требует, чтобы я присвоил dfпеременную, прежде чем смогу фильтровать ее значения. Есть …
329 python  pandas  dataframe 


23
Как создать тестовые и обучающие образцы из одного кадра данных с пандами?
У меня есть довольно большой набор данных в виде фрейма данных, и мне было интересно, как я смогу разделить фрейм данных на две случайные выборки (80% и 20%) для обучения и тестирования. Спасибо!

7
Панды read_csv low_memory и опции dtype
При звонке df = pd.read_csv('somefile.csv') Я получил: /Users/josh/anaconda/envs/py27/lib/python2.7/site-packages/pandas/io/parsers.py:1130: DtypeWarning: столбцы (4,5,7,16) имеют смешанные типы. Укажите опцию dtype при импорте или установите low_memory = False. Почему этот dtypeвариант связан с этим low_memoryи почему он Falseпоможет решить эту проблему?


11
Как хранить данные с помощью Pandas
Прямо сейчас я импортирую довольно большой CSVфайл данных каждый раз, когда запускаю скрипт. Есть ли хорошее решение для того, чтобы держать этот фрейм данных постоянно доступным между запусками, чтобы мне не пришлось тратить все это время на ожидание запуска скрипта?
317 python  pandas  dataframe 

5
Панды создают новый столбец на основе значений из других столбцов / применяют функцию из нескольких столбцов, построчно
Я хочу , чтобы применить свою пользовательскую функцию (она использует если-иначе лестница) в этих шести колонн ( ERI_Hispanic, ERI_AmerInd_AKNatv, ERI_Asian, ERI_Black_Afr.Amer, ERI_HI_PacIsl, ERI_White) в каждой строке моего dataframe. Я пробовал разные методы из других вопросов, но все еще не могу найти правильный ответ для моей проблемы. Критическим моментом является то, …
316 python  pandas  numpy  apply 

8
Pandas условное создание столбца серии / dataframe
У меня есть датафрейм по линии ниже: Type Set 1 A Z 2 B Z 3 B X 4 C Y Я хочу добавить еще один столбец к фрейму данных (или сгенерировать серию) той же длины, что и фрейм данных (= равное количество записей / строк), который устанавливает зеленый цвет, …


6
Удалите строки из DataFrame pandas на основе условного выражения с использованием len (string), дающего KeyError
У меня есть DataFrame pandas, и я хочу удалить из него строки, где длина строки в определенном столбце больше 2. Я ожидаю, что смогу сделать это (за этот ответ ): df[(len(df['column name']) < 2)] но я просто получаю ошибку: KeyError: u'no item named False' Что я делаю не так? (Примечание: …
303 python  pandas 

7
Панды - Получить значение первой строки данного столбца
Это кажется нелепо простым вопросом ... но я не вижу простого ответа, которого ожидал. Итак, как мне получить значение в n-й строке данного столбца в Pandas? (Я особенно заинтересован в первом ряду, но также был бы заинтересован в более общей практике). Например, скажем, я хочу получить значение 1.2 в Btime …
301 python  pandas  indexing  head 

15
Преобразуйте Python dict в информационный фрейм
У меня есть словарь Python, как следующий: {u'2012-06-08': 388, u'2012-06-09': 388, u'2012-06-10': 388, u'2012-06-11': 389, u'2012-06-12': 389, u'2012-06-13': 389, u'2012-06-14': 389, u'2012-06-15': 389, u'2012-06-16': 389, u'2012-06-17': 389, u'2012-06-18': 390, u'2012-06-19': 390, u'2012-06-20': 390, u'2012-06-21': 390, u'2012-06-22': 390, u'2012-06-23': 390, u'2012-06-24': 390, u'2012-06-25': 391, u'2012-06-26': 391, u'2012-06-27': 391, u'2012-06-28': 391, u'2012-06-29': …
299 python  pandas  dataframe 


12
Преобразование между datetime, Timestamp и datetime64
Как мне преобразовать numpy.datetime64объект в datetime.datetime(или Timestamp)? В следующем коде я создаю объекты datetime, timestamp и datetime64. import datetime import numpy as np import pandas as pd dt = datetime.datetime(2012, 5, 1) # A strange way to extract a Timestamp object, there's surely a better way? ts = pd.DatetimeIndex([dt])[0] dt64 …
292 python  datetime  numpy  pandas 

8
Количество панд (отличный) эквивалент
Я использую панд в качестве заменителя БД, так как у меня есть несколько баз данных (oracle, mssql и т. Д.), И я не могу сделать последовательность команд в эквиваленте SQL. У меня есть таблица, загруженная в DataFrame с несколькими столбцами: YEARMONTH, CLIENTCODE, SIZE, .... etc etc В SQL для подсчета …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.