Вопросы с тегом «pandas»

Pandas - это библиотека Python для манипулирования и анализа данных, например, фреймов данных, многомерных временных рядов и наборов данных поперечного сечения, обычно встречающихся в статистике, результатах экспериментальной науки, эконометрике или финансах. Pandas - одна из основных библиотек данных в Python.

4
python pandas: применить функцию с аргументами к серии
Я хочу применить функцию с аргументами к серии в python pandas: x = my_series.apply(my_function, more_arguments_1) y = my_series.apply(my_function, more_arguments_2) ... В документации описывается поддержка метода apply, но он не принимает никаких аргументов. Есть ли другой метод, принимающий аргументы? Или мне не хватает простого обходного пути? Обновление (октябрь 2017 г.): обратите …
150 python  pandas  apply 

14
Процент панд от общего с групповым
Это очевидно просто, но как новичок я застрял. У меня есть CSV-файл, который содержит 3 столбца: штат, идентификатор офиса и продажи для этого офиса. Я хочу рассчитать процент продаж на офис в данном состоянии (общее количество всех процентов в каждом штате составляет 100%). df = pd.DataFrame({'state': ['CA', 'WA', 'CO', 'AZ'] …
148 python  pandas 

5
Изменение подмножества строк в кадре данных pandas
Предположим, у меня есть DataFrame pandas с двумя столбцами, A и B. Я хотел бы изменить этот DataFrame (или создать копию), чтобы B всегда был NaN, когда A равно 0. Как мне этого добиться? Я пробовал следующее df['A'==0]['B'] = np.nan а также df['A'==0]['B'].values.fill(np.nan) безуспешно.
148 python  pandas 

10
Разделение словаря / списка внутри столбца панд на отдельные столбцы
У меня есть данные, сохраненные в базе данных postgreSQL. Я запрашиваю эти данные с помощью Python2.7 и превращаю их в Pandas DataFrame. Однако последний столбец этого информационного кадра содержит словарь (или список?) Значений внутри него. DataFrame выглядит следующим образом: [1] df Station ID Pollutants 8809 {"a": "46", "b": "3", "c": …

2
Выберите строки в pandas MultiIndex DataFrame
Каковы наиболее распространенные способы выбора / фильтрации строк фрейма данных, индекс которого является MultiIndex ? Нарезка на основе одного значения / метки Нарезка на основе нескольких этикеток с одного или нескольких уровней Фильтрация по логическим условиям и выражениям Какие методы применимы в каких обстоятельствах Предположения для простоты: входной фрейм данных …


5
Как разбить данные на 3 набора (тренировка, проверка и тестирование)?
У меня есть датафрейм pandas, и я хочу разделить его на 3 отдельных набора. Я знаю , что с помощью train_test_split из sklearn.cross_validation, можно разделить данные в двух сетах (поезд и тест). Тем не менее, я не смог найти никакого решения о разделении данных на три набора. Желательно, чтобы у …

6
Проверьте, существует ли значение в индексе фрейма данных pandas
Я уверен, что есть очевидный способ сделать это, но сейчас не могу придумать ничего приятного. В основном, вместо того, чтобы вызывать исключение, я хотел бы получить Trueили Falseувидеть, существует ли значение в dfиндексе pandas . import pandas as pd df = pd.DataFrame({'test':[1,2,3,4]}, index=['a','b','c','d']) df.loc['g'] # (should give False) Сейчас я …
145 python  pandas  ipython 

7
Чтение файла Excel в Python с использованием панд
Я пытаюсь прочитать файл Excel следующим образом: newFile = pd.ExcelFile(PATH\FileName.xlsx) ParsedData = pd.io.parsers.ExcelFile.parse(newFile) которая выдает ошибку, которая говорит о двух ожидаемых аргументах, я не знаю, что является вторым аргументом, а также что я пытаюсь достичь здесь, это преобразовать файл Excel в DataFrame. Я делаю это правильно? или есть ли другой …

10
JSON для панд DataFrame
Я пытаюсь извлечь данные о высоте из API карт Google по пути, указанному координатами широты и долготы, следующим образом: from urllib2 import Request, urlopen import json path1 = '42.974049,-81.205203|42.974298,-81.195755' request=Request('http://maps.googleapis.com/maps/api/elevation/json?locations='+path1+'&sensor=false') response = urlopen(request) elevations = response.read() Это дает мне данные, которые выглядят так: elevations.splitlines() ['{', ' "results" : [', ' …

6
Панды: поиск списка листов в файле Excel
Новая версия Pandas использует следующий интерфейс для загрузки файлов Excel: read_excel('path_to_file.xls', 'Sheet1', index_col=None, na_values=['NA']) но что если я не знаю доступные листы? Например, я работаю с файлами Excel, которые следующие листы Данные 1, Данные 2 ..., Данные N, foo, bar но я не знаю Nаприори. Есть ли способ получить список …
144 python  excel  pandas  openpyxl  xlrd 

7
Как найти, какие столбцы содержат любое значение NaN в кадре данных Pandas
Дан кадр данных панд, содержащий возможные значения NaN, разбросанные здесь и там: Вопрос: Как определить, какие столбцы содержат значения NaN? В частности, могу ли я получить список имен столбцов, содержащих NaN?
144 python  pandas  dataframe  nan 

8
Переименовать Pandas DataFrame Index
У меня есть CSV-файл без заголовка с индексом DateTime. Я хочу переименовать индекс и имя столбца, но с помощью df.rename () переименовывается только имя столбца. Ошибка? Я на версии 0.12.0 In [2]: df = pd.read_csv(r'D:\Data\DataTimeSeries_csv//seriesSM.csv', header=None, parse_dates=[[0]], index_col=[0] ) In [3]: df.head() Out[3]: 1 0 2002-06-18 0.112000 2002-06-22 0.190333 2002-06-26 …
142 python  pandas  dataframe 

6
Искать «не содержит» в DataFrame в pandas
Я немного поискал и не могу понять, как отфильтровать фрейм данных df["col"].str.contains(word), однако мне интересно, есть ли способ сделать обратное: отфильтровать фрейм данных с помощью этого набора. например: эффект !(df["col"].str.contains(word)). Можно ли это сделать с помощью DataFrameметода?
142 python  pandas  contains 

11
Замена значений столбцов в панде DataFrame
Я пытаюсь заменить значения в одном столбце данных. Столбец («женский») содержит только значения «женский» и «мужской». Я пробовал следующее: w['female']['female']='1' w['female']['male']='0' Но получите точно такую ​​же копию предыдущих результатов. В идеале я хотел бы получить некоторый вывод, который похож на следующий цикл поэлементно. if w['female'] =='female': w['female'] = '1'; else: …
141 python  pandas 

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.