Вопросы с тегом «pandas»

Pandas - это библиотека Python для манипулирования и анализа данных, например, фреймов данных, многомерных временных рядов и наборов данных поперечного сечения, обычно встречающихся в статистике, результатах экспериментальной науки, эконометрике или финансах. Pandas - одна из основных библиотек данных в Python.


9
Что означает «ValueError: невозможно переиндексировать с дублированной оси»?
Я получаю, ValueError: cannot reindex from a duplicate axisкогда я пытаюсь установить индекс на определенное значение. Я попытался воспроизвести это на простом примере, но я не смог этого сделать. Вот мой сеанс внутри ipdbтрассировки. У меня есть DataFrame со строковым индексом и целочисленными столбцами, значениями с плавающей запятой. Однако, когда …
255 python  pandas 

3
Как отсортировать dataFrame в python панды по двум или более столбцам?
Предположим, у меня есть фрейм данных со столбцами a, bи cя хочу отсортировать фрейм данных по столбцу bв порядке возрастания и по столбцу cв порядке убывания, как мне это сделать?

9
Название или название столбца индекса панд
Как я могу получить имя столбца индекса в пандах Python? Вот пример кадра данных: Column 1 Index Title Apples 1 Oranges 2 Puppies 3 Ducks 4 Я пытаюсь получить / установить заголовок индекса данных. Вот что я попробовал: import pandas as pd data = {'Column 1' : [1., 2., 3., …

6
Удалить строки с дублирующимися индексами (Pandas DataFrame и TimeSeries)
Я читаю некоторые автоматические данные о погоде из Интернета. Наблюдения происходят каждые 5 минут и собираются в ежемесячные файлы для каждой метеостанции. Как только я закончу анализ файла, DataFrame будет выглядеть примерно так: Sta Precip1hr Precip5min Temp DewPnt WindSpd WindDir AtmPress Date 2001-01-01 00:00:00 KPDX 0 0 4 3 0 …
252 python  pandas 


11
Получить ряд (ы), которые имеют максимальное количество в группах, используя групповой
Как найти все строки в кадре данных pandas, которые имеют максимальное значение для countстолбца, после группировки по ['Sp','Mt']столбцам? Пример 1: следующий dataFrame, который я группирую по ['Sp','Mt']: Sp Mt Value count 0 MM1 S1 a **3** 1 MM1 S1 n 2 2 MM1 S3 cb 5 3 MM2 S3 mk …

7
Показать DataFrame в виде таблицы в iPython Notebook
Я использую ноутбук iPython. Когда я делаю это: df Я получаю красивый стол с клетками. Однако, если я сделаю это: df1 df2 он не печатает первый красивый стол. Если я попробую это: print df1 print df2 Он печатает таблицу в другом формате, который разбрасывает столбцы и делает вывод очень высоким. …

7
Панды: сбросить уровень из многоуровневого индекса столбца?
Если у меня есть многоуровневый индекс столбца: >>> cols = pd.MultiIndex.from_tuples([("a", "b"), ("a", "c")]) >>> pd.DataFrame([[1,2], [3,4]], columns=cols) --- + - б | с - + --- + - 0 | 1 | 2 1 | 3 | 4 Как я могу опустить уровень «a» этого индекса, чтобы я в …
243 python  pandas 

5
Конвертировать Pandas Column в DateTime
У меня есть одно поле в DataFrame панд, который был импортирован в виде строки. Это должна быть переменная datetime. Как преобразовать его в столбец даты и времени, а затем отфильтровать по дате. Пример: Имя фрейма данных : raw_data Название колонки: Mycol Формат значения в столбце: «05SEP2014: 00: 00: 00.000»
243 python  datetime  pandas 

6
Почему не работает моя функция «Применить», относящаяся к нескольким столбцам? [закрыто]
Закрыто. Этот вопрос не воспроизводится или был вызван опечатками . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме переполнения стека. Закрыто в прошлом году . Улучшить этот вопрос У меня есть некоторые проблемы с функцией применения Pandas при использовании нескольких столбцов …



4
Выбор по сложным критериям из панд. DataFrame
Например, у меня есть простой DF: import pandas as pd from random import randint df = pd.DataFrame({'A': [randint(1, 9) for x in xrange(10)], 'B': [randint(1, 9)*10 for x in xrange(10)], 'C': [randint(1, 9)*100 for x in xrange(10)]}) Могу ли я выбрать значения из «A», для которых соответствующие значения для «B» …
235 python  pandas 

3
Как выбрать строки с одним или несколькими нулями в панде DataFrame без явного перечисления столбцов?
У меня есть датафрейм с ~ 300K строк и ~ 40 столбцов. Я хочу выяснить, содержат ли какие-либо строки нулевые значения, и поместить эти «нулевые» строки в отдельный фрейм данных, чтобы их можно было легко изучить. Я могу создать маску явно: mask = False for col in df.columns: mask = …
234 python  pandas  null  nan 

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.