Вопросы с тегом «pandas»

Pandas - это библиотека Python для манипулирования и анализа данных, например, фреймов данных, многомерных временных рядов и наборов данных поперечного сечения, обычно встречающихся в статистике, результатах экспериментальной науки, эконометрике или финансах. Pandas - одна из основных библиотек данных в Python.

10
Конвертировать поплавки в панды в броню?
Я работал с данными, импортированными из CSV. Панды изменили некоторые столбцы на плавающие, так что теперь числа в этих столбцах отображаются как плавающие точки! Однако мне нужно, чтобы они отображались в виде целых чисел или без запятой. Есть ли способ преобразовать их в целые числа или не отображать запятую?

12
Панды получают строки, которых нет в другом фрейме данных
У меня есть два фрейма данных панд, у которых есть несколько общих строк. Предположим, dataframe2 является подмножеством dataframe1. Как я могу получить строки dataframe1, которых нет в dataframe2? df1 = pandas.DataFrame(data = {'col1' : [1, 2, 3, 4, 5], 'col2' : [10, 11, 12, 13, 14]}) df2 = pandas.DataFrame(data = …
230 python  pandas  dataframe 

5
Как я могу получить поэлементное логическое НЕ Серии Панд?
У меня есть Seriesобъект Pandas, содержащий логические значения. Как я могу получить серию, содержащую логическое NOTкаждого значения? Например, рассмотрим серию, содержащую: True True True False Ряд, который я хотел бы получить, содержал бы: False False False True Кажется, это должно быть достаточно просто, но, видимо, я потерял моё умение = …

10
Сохраняйте только часть даты при использовании pandas.to_datetime
Я использую pandas.to_datetimeдля разбора дат в моих данных. Pandas по умолчанию представляет даты, datetime64[ns]хотя все даты только ежедневные. Интересно, есть ли элегантный / умный способ преобразовать даты в datetime.dateили datetime64[D]так, чтобы при записи данных в CSV к датам не добавлялись 00:00:00. Я знаю, что могу преобразовать тип вручную поэлементно: [dt.to_datetime().date() …
229 python  pandas  csv  datetime  series 

19
Нормализовать столбцы панд данных
У меня есть датафрейм в пандах, где каждый столбец имеет различный диапазон значений. Например: ДФ: A B C 1000 10 0.5 765 5 0.35 800 7 0.09 Любая идея, как я могу нормализовать столбцы этого кадра данных, где каждое значение находится между 0 и 1? Мой желаемый результат: A B …

5
Как сделать хорошие воспроизводимые примеры панд
Ответы на этот вопрос - работа сообщества . Отредактируйте существующие ответы, чтобы улучшить этот пост. В настоящее время он не принимает новые ответы или взаимодействия. Потратив приличное количество времени на просмотр обоих р и пандтеги на SO, создается впечатление, что pandasвопросы с меньшей вероятностью содержат воспроизводимые данные. Это то , …
221 python  pandas 

6
Применение нескольких функций к нескольким групповым столбцам
В документах показывают , как применить несколько функций на объекте GroupBy в то время , используя Dict с именами вывода столбцов в качестве ключей: In [563]: grouped['D'].agg({'result1' : np.sum, .....: 'result2' : np.mean}) .....: Out[563]: result2 result1 A bar -0.579846 -1.739537 foo -0.280588 -1.402938 Однако это работает только для объекта …

11
Извлечение только Месяца и Года отдельно от столбца Pandas Datetime
У меня есть Dataframe, df, со следующим столбцом: df['ArrivalDate'] = ... 936 2012-12-31 938 2012-12-29 965 2012-12-31 966 2012-12-31 967 2012-12-31 968 2012-12-31 969 2012-12-31 970 2012-12-29 971 2012-12-31 972 2012-12-29 973 2012-12-29 ... Элементами столбца являются pandas.tslib.Timestamp. Я хочу просто указать год и месяц. Я думал, что будет простой …
221 python  pandas 

7
отбрасывать бесконечные значения из информационных кадров в пандах?
Каков самый быстрый / простой способ отбросить значения nan и inf / -inf из DataFrame pandas без сброса mode.use_inf_as_null? Я хотел бы иметь возможность использовать аргументы subsetи , за исключением значений, которые считаются пропущенными, например:howdropnainf df.dropna(subset=["col1", "col2"], how="all", with_inf=True) Это возможно? Есть ли способ сказать, dropnaчтобы включить infв его определение …
220 python  numpy  scipy  pandas 



20
Кодирование меток в нескольких столбцах в scikit-learn
Я пытаюсь использовать scikit-learn's LabelEncoderдля кодирования панд DataFrameстроковых меток. Поскольку в фрейме данных есть много (более 50) столбцов, я хочу избежать создания LabelEncoderобъекта для каждого столбца; Я бы предпочел просто иметь один большой LabelEncoderобъект, который работает во всех моих столбцах данных. Бросок всего DataFrameв LabelEncoderсоздает следующую ошибку. Пожалуйста, имейте в …

13
Применить функцию панды к столбцу, чтобы создать несколько новых столбцов?
Как это сделать в пандах: У меня есть функция extract_text_featuresдля одного текстового столбца, возвращающая несколько выходных столбцов. В частности, функция возвращает 6 значений. Функция работает, однако, похоже, не существует какого-либо правильного возвращаемого типа (pandas DataFrame / numpy array / Python list), чтобы выходные данные могли быть правильно назначены df.ix[: ,10:16] …

5
Как отобразить полную (не усеченную) информацию о фрейме данных в html при конвертации из фрейма данных pandas в html?
Я преобразовал pandas dataframe в вывод html, используя DataFrame.to_htmlфункцию. Когда я сохраняю это в отдельный HTML-файл, файл показывает усеченный вывод. Например, в моей колонке ТЕКСТ, df.head(1) покажет Фильм был отличным усилием ... вместо того Фильм был отличным усилием в деконструкции сложных социальных настроений, которые преобладали в этот период. Это представление …
214 python  html  pandas 

8
Обновите фрейм данных в пандах, повторяя построчно
У меня есть фрейм данных панд, который выглядит следующим образом (это довольно большой) date exer exp ifor mat 1092 2014-03-17 American M 528.205 2014-04-19 1093 2014-03-17 American M 528.205 2014-04-19 1094 2014-03-17 American M 528.205 2014-04-19 1095 2014-03-17 American M 528.205 2014-04-19 1096 2014-03-17 American M 528.205 2014-05-17 Теперь я …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.