программирование dataframe

3

Аннотирование столбцов со значениями на диаграммах столбцов Pandas

Я искал способ аннотировать свои столбцы на графике столбцов Pandas округленными числовыми значениями из моего DataFrame. >>> df=pd.DataFrame({'A':np.random.rand(2),'B':np.random.rand(2)},index=['value1','value2'] ) >>> df A B value1 0.440922 0.911800 value2 0.588242 0.797366 Хотелось бы получить примерно такое: Я пробовал использовать этот образец кода, но все аннотации сосредоточены на отметках x: >>> ax = …

89 python matplotlib plot pandas dataframe

13

Сравнение двух фреймов данных и получение различий

У меня есть два фрейма данных. Примеры: df1: Date Fruit Num Color 2013-11-24 Banana 22.1 Yellow 2013-11-24 Orange 8.6 Orange 2013-11-24 Apple 7.6 Green 2013-11-24 Celery 10.2 Green df2: Date Fruit Num Color 2013-11-24 Banana 22.1 Yellow 2013-11-24 Orange 8.6 Orange 2013-11-24 Apple 7.6 Green 2013-11-24 Celery 10.2 Green 2013-11-25 …

89 python pandas dataframe

5

Spark DataFrame groupBy и сортировка в порядке убывания (pyspark)

Я использую pyspark (Python 2.7.9 / Spark 1.3.1) и имею объект GroupObject фрейма данных, который мне нужно фильтровать и сортировать в порядке убывания. Пытаюсь достичь этого с помощью этого фрагмента кода. group_by_dataframe.count().filter("`count` >= 10").sort('count', ascending=False) Но это вызывает следующую ошибку. sort() got an unexpected keyword argument 'ascending'

88 python apache-spark dataframe pyspark apache-spark-sql

5

как разделить столбец кортежей в кадре данных pandas?

У меня есть фреймворк pandas (это всего лишь небольшая часть) >>> d1 y norm test y norm train len(y_train) len(y_test) \ 0 64.904368 116.151232 1645 549 1 70.852681 112.639876 1645 549 SVR RBF \ 0 (35.652207342877873, 22.95533537448393) 1 (39.563683797747622, 27.382483096332511) LCV \ 0 (19.365430594452338, 13.880062435173587) 1 (19.099614489458364, 14.018867136617146) RIDGE CV …

88 python numpy pandas dataframe tuples

6

Как добавить суффикс (или префикс) к имени каждого столбца?

Я хочу добавить _xсуффикс к имени каждого столбца, например: featuresA = myPandasDataFrame.columns.values + '_x' Как мне это сделать? Кроме того, если бы я хотел добавить x_суффикс, как бы изменилось решение?

88 python pandas dataframe

7

Замена нескольких значений в столбце фрейма данных pandas другим значением

У меня есть df кадра данных pandas, как показано ниже: BrandName Specialty A H B I ABC J D K AB L Я хочу заменить «ABC» и «AB» в столбце BrandName на A. Может ли кто-нибудь помочь с этим?

88 python replace pandas dataframe

17

Добавить (вставить) столбец между двумя столбцами в data.frame

У меня есть фрейм данных, в котором есть столбцы a, b и c. Я хочу добавить новый столбец d между b и c. Я знаю, что могу просто добавить d в конце, используя cbind, но как я могу вставить его между двумя столбцами?

87 r dataframe insert

1

Применить функцию к каждой ячейке в DataFrame

У меня есть фрейм данных, который может выглядеть так: A B C foo bar foo bar bar foo foo bar Я хочу просмотреть каждый элемент каждой строки (или каждый элемент каждого столбца) и применить следующую функцию, чтобы получить последующий DF: def foo_bar(x): return x.replace('foo', 'wow') A B C wow bar …

87 python pandas dataframe apply

5

Сдвинуть столбец в кадре данных pandas на один?

У меня есть фреймворк pandas. Я хочу «запаздывать» одну из моих колонок. Это означает, например, сдвиг всего столбца 'gdp' вверх на единицу, а затем удаление всех лишних данных в нижней части оставшихся строк, чтобы все столбцы снова стали равной длины. df = y gdp cap 0 1 2 5 1 …

87 python pandas dataframe

7

Выбрать первую строку по группе

Из такого фрейма данных test <- data.frame('id'= rep(1:5,2), 'string'= LETTERS[1:10]) test <- test[order(test$id), ] rownames(test) <- 1:10 > test id string 1 1 A 2 1 F 3 2 B 4 2 G 5 3 C 6 3 H 7 4 D 8 4 I 9 5 E 10 5 …

87 r dataframe sqldf

3

Разделить большой фрейм данных на список фреймов данных на основе общего значения в столбце

У меня есть фрейм данных с 10 столбцами, собирающими действия «пользователей», где один из столбцов содержит идентификатор (не уникальный, идентифицирующий пользователя) (столбец 10). длина кадра данных составляет около 750000 строк. Я пытаюсь извлечь отдельные фреймы данных (чтобы получить список или вектор фреймов данных), разделенные по столбцу, содержащему идентификатор «пользователя», чтобы …

86 r performance matrix split dataframe

5

Преобразование именованного вектора символов в data.frame

У меня есть именованный вектор символов, возвращаемый из xmlAttrs следующим образом: testVect <- structure(c("11.2.0.3.0", "12.89", "12.71"), .Names = c("db_version", "elapsed_time", "cpu_time")) Я хотел бы преобразовать его во фрейм данных, который выглядит так: testDF <- data.frame("db_version"="11.2.0.3.0","elapsed_time"=12.89,"cpu_time"=12.71) head(testDF) db_version elapsed_time cpu_time 1 11.2.0.3.0 12.89 12.71

86 r dataframe vector type-conversion

3

Объедините два фрейма данных pandas (объедините в общем столбце)

У меня есть 2 фрейма данных: restaurant_ids_dataframe Data columns (total 13 columns): business_id 4503 non-null values categories 4503 non-null values city 4503 non-null values full_address 4503 non-null values latitude 4503 non-null values longitude 4503 non-null values name 4503 non-null values neighborhoods 4503 non-null values open 4503 non-null values review_count 4503 …

86 python pandas dataframe merge left-join

2

Переопределение индекса в объекте Pandas DataFrame

Я пытаюсь переиндексировать DataFrameобъект pandas , например, From: a b c 0 1 2 3 1 10 11 12 2 20 21 22 To : b c 1 2 3 10 11 12 20 21 22 Я делаю это, как показано ниже, и получаю неправильный ответ. Есть подсказки, как это …

84 python pandas dataframe

7

Найдите уникальные значения в столбце и отсортируйте их

У меня есть фреймворк pandas. Я хочу напечатать уникальные значения одного из его столбцов в порядке возрастания. Вот как я это делаю: import pandas as pd df = pd.DataFrame({'A':[1,1,3,2,6,2,8]}) a = df['A'].unique() print a.sort() Проблема в том, что я получаю Noneна выходе.

84 python pandas sorting dataframe unique

Вопросы с тегом «dataframe»