программирование pandas

2

Pandas: создайте два новых столбца в фрейме данных со значениями, вычисленными из уже существующего столбца

Я работаю с библиотекой pandas и хочу добавить два новых столбца в фрейм данных dfс n столбцами (n> 0). Эти новые столбцы являются результатом применения функции к одному из столбцов во фрейме данных. Применяемая функция выглядит так: def calculate(x): ...operate... return z, y Один из способов создания нового столбца для …

100 python pandas

4

Создание нового столбца на основе условия if-elif-else

У меня есть DataFrame df: A B a 2 2 b 3 1 c 1 3 Я хочу создать новый столбец на основе следующих критериев: если строка A == B: 0 если строкаA > B: 1 если строка A < B: -1 поэтому, учитывая приведенную выше таблицу, это должно быть: …

100 python pandas conditional

6

Подсчет уникальных значений в столбце в фрейме данных pandas, как в Qlik?

Если у меня есть такая таблица: df = pd.DataFrame({ 'hID': [101, 102, 103, 101, 102, 104, 105, 101], 'dID': [10, 11, 12, 10, 11, 10, 12, 10], 'uID': ['James', 'Henry', 'Abe', 'James', 'Henry', 'Brian', 'Claude', 'James'], 'mID': ['A', 'B', 'A', 'B', 'A', 'A', 'A', 'C'] }) Я могу сделать count(distinct …

100 python pandas numpy qlikview qliksense

11

FutureWarning: поэлементное сравнение не выполнено; возвращает скаляр, но в дальнейшем будет выполнять поэлементное сравнение

Я использую Pandas 0.19.1на Python 3. Я получаю предупреждение об этих строках кода. Я пытаюсь получить список, содержащий все номера строк, в которых строка Peterприсутствует в столбце Unnamed: 5. df = pd.read_excel(xls_path) myRows = df[df['Unnamed: 5'] == 'Peter'].index.tolist() Выдает предупреждение: "\Python36\lib\site-packages\pandas\core\ops.py:792: FutureWarning: elementwise comparison failed; returning scalar, but in the …

100 python python-3.x pandas numpy matplotlib

12

Как импортировать данные из mongodb в pandas?

У меня есть большой объем данных в коллекции в mongodb, которые мне нужно проанализировать. Как мне импортировать эти данные в панды? Я новичок в pandas и numpy. РЕДАКТИРОВАТЬ: коллекция mongodb содержит значения датчиков, помеченные датой и временем. Значения датчиков имеют тип данных float. Пример данных: { "_cls" : "SensorReport", "_id" …

99 python mongodb pandas pymongo

6

Пропустить строки во время импорта csv pandas

Я пытаюсь импортировать файл .csv pandas.read_csv(), но не хочу импортировать вторую строку файла данных (строку с индексом = 1 для 0-индексации). Я не понимаю, как не импортировать его, потому что аргументы, используемые с командой, кажутся неоднозначными: С сайта панд: skiprows : список или целое число Номера строк, которые нужно пропустить …

99 python csv pandas

8

Преобразование DateTimeIndex с учетом часового пояса pandas в наивную метку времени, но в определенном часовом поясе

Вы можете использовать эту функцию, tz_localizeчтобы сделать отметку времени или DateTimeIndex осведомленной о часовом поясе, но как вы можете сделать обратное: как вы можете преобразовать временную метку, учитывающую часовой пояс, в наивную, сохраняя при этом часовой пояс? Пример: In [82]: t = pd.date_range(start="2013-05-18 12:00:00", periods=10, freq='s', tz="Europe/Brussels") In [83]: t …

99 python pandas

5

Заменить None на NaN в кадре данных pandas

У меня есть таблица x: website 0 http://www.google.com/ 1 http://www.yahoo.com 2 None Я хочу заменить python None на pandas NaN. Я старался: x.replace(to_replace=None, value=np.nan) Но я получил: TypeError: 'regex' must be a string or a compiled regular expression or a list or dict of strings or regular expressions, you passed …

99 pandas dataframe replace nan nonetype

10

GroupBy pandas DataFrame и выберите наиболее распространенное значение

У меня есть фрейм данных с тремя строковыми столбцами. Я знаю, что единственное значение в 3-м столбце действительно для каждой комбинации первых двух. Чтобы очистить данные, мне нужно сгруппировать данные по фреймам по первым двум столбцам и выбрать наиболее распространенное значение третьего столбца для каждой комбинации. Мой код: import pandas …

99 python pandas group-by pandas-groupby mode

7

Как установить ячейку в NaN в кадре данных pandas

Я хотел бы заменить неверные значения в столбце фрейма данных на NaN. mydata = {'x' : [10, 50, 18, 32, 47, 20], 'y' : ['12', '11', 'N/A', '13', '15', 'N/A']} df = pd.DataFrame(mydata) df[df.y == 'N/A']['y'] = np.nan Однако последняя строка не работает и выдает предупреждение, потому что она работает …

98 python pandas nan

5

Как я могу сделать заголовки столбцов фрейма данных pandas строчными буквами?

Я хочу сделать все заголовки столбцов в нижнем регистре моего фрейма данных pandas пример Если бы у меня был: data = country country isocode year XRAT tcgdp 0 Canada CAN 2001 1.54876 924909.44207 1 Canada CAN 2002 1.56932 957299.91586 2 Canada CAN 2003 1.40105 1016902.00180 .... Я хотел бы изменить …

98 python pandas dataframe

7

Pandas, выбирающий по метке, иногда возвращает Series, иногда возвращает DataFrame

В Pandas, когда я выбираю метку, которая имеет только одну запись в индексе, я возвращаю серию, но когда я выбираю запись, которая имеет более одной записи, я возвращаю фрейм данных. Почему это? Есть ли способ гарантировать, что я всегда получу фрейм данных? In [1]: import pandas as pd In [2]: …

98 python pandas dataframe slice series

10

Python Pandas - Найдите разницу между двумя фреймами данных

У меня есть два фрейма данных df1 и df2, где df2 - это подмножество df1. Как мне получить новый фрейм данных (df3), который является разницей между двумя фреймами данных? Другими словами, фрейм данных, в котором есть все строки / столбцы в df1, которых нет в df2?

98 python pandas dataframe

5

pandas read_csv и фильтровать столбцы с помощью usecols

У меня есть файл csv, который не отображается правильно, pandas.read_csvкогда я фильтрую столбцы usecolsи использую несколько индексов. import pandas as pd csv = r"""dummy,date,loc,x bar,20090101,a,1 bar,20090102,a,3 bar,20090103,a,5 bar,20090101,b,1 bar,20090102,b,3 bar,20090103,b,5""" f = open('foo.csv', 'w') f.write(csv) f.close() df1 = pd.read_csv('foo.csv', header=0, names=["dummy", "date", "loc", "x"], index_col=["date", "loc"], usecols=["dummy", "date", "loc", "x"], …

98 python pandas csv csv-import

6

Преобразование фрейма данных pandas в серию

Я новичок в пандах. У меня есть кадр данных pandas, который составляет 1 строку на 23 столбца. Я хочу преобразовать это в серию? Мне интересно, какой самый питонический способ сделать это? Я пробовал, pd.Series(myResults)но жалуется ValueError: cannot copy sequence with size 23 to array axis with dimension 1. Он недостаточно …

98 python pandas dataframe series

Вопросы с тегом «pandas»