Вопросы с тегом «dataframe»

Фрейм данных является табличной структурой данных. Обычно он содержит данные, где строки - это наблюдения, а столбцы - переменные различных типов. В то время как «фрейм данных» или «фрейм данных» - это термин, используемый для этой концепции в нескольких языках (R, Apache Spark, deedle, Maple, библиотека pandas в Python и библиотека DataFrames в Julia), «таблица» - это термин, используемый в MATLAB и SQL.



6
Подмножество строк, содержащих значения NA (отсутствующие) в выбранном столбце фрейма данных
У нас есть фрейм данных из файла CSV. Во фрейме данных DFесть столбцы, содержащие наблюдаемые значения, и столбец ( VaR2), содержащий дату, когда было выполнено измерение. Если дата не была записана, CSV-файл содержит значение NAдля отсутствующих данных. Var1 Var2 10 2010/01/01 20 NA 30 2010/03/01 Мы хотели бы использовать команду …
96 r  csv  dataframe  subset  na 

11
Как разбить список внутри ячейки Dataframe на отдельные строки
Я хочу превратить ячейку pandas, содержащую список, в строки для каждого из этих значений. Итак, возьмите это: Если я хочу распаковать и сложить значения в nearest_neighborsстолбце, чтобы каждое значение было строкой в ​​каждом opponentиндексе, как мне лучше всего это сделать? Существуют ли методы pandas, предназначенные для подобных операций?


16
Как выбрать строку с максимальным значением в каждой группе
В наборе данных с несколькими наблюдениями для каждого субъекта я хочу взять подмножество только с максимальным значением данных для каждой записи. Например, со следующим набором данных: ID <- c(1,1,1,2,2,2,2,3,3) Value <- c(2,3,5,2,5,8,17,3,5) Event <- c(1,1,2,1,2,1,2,2,2) group <- data.frame(Subject=ID, pt=Value, Event=Event) У субъектов 1, 2 и 3 наибольшее значение балла составляет …
94 r  dataframe  r-faq 

6
Есть ли способ в Pandas использовать предыдущее значение строки в dataframe.apply, когда предыдущее значение также вычисляется в приложении?
У меня есть следующий фреймворк: Index_Date A B C D =============================== 2015-01-31 10 10 Nan 10 2015-02-01 2 3 Nan 22 2015-02-02 10 60 Nan 280 2015-02-03 10 100 Nan 250 Требовать: Index_Date A B C D =============================== 2015-01-31 10 10 10 10 2015-02-01 2 3 23 22 2015-02-02 10 …

6
Переименование имен столбцов DataFrame в Spark Scala
Я пытаюсь преобразовать все заголовки / имена столбцов DataFrameв Spark-Scala. на данный момент я придумываю следующий код, который заменяет только одно имя столбца. for( i <- 0 to origCols.length - 1) { df.withColumnRenamed( df.columns(i), df.columns(i).toLowerCase ); }

3
Python: получить счетчик частоты на основе двух столбцов (переменных) в кадре данных pandas в некоторых приложениях строк
Здравствуйте, у меня есть следующий фрейм данных. Group Size Short Small Short Small Moderate Medium Moderate Small Tall Large Я хочу подсчитать, сколько раз одна и та же строка появляется в кадре данных. Group Size Time Short Small 2 Moderate Medium 1 Moderate Small 1 Tall Large 1

6
Преобразование серии pandas в DataFrame
У меня есть серия Pandas sf: email email1@email.com [1.0, 0.0, 0.0] email2@email.com [2.0, 0.0, 0.0] email3@email.com [1.0, 0.0, 0.0] email4@email.com [4.0, 0.0, 0.0] email5@email.com [1.0, 0.0, 3.0] email6@email.com [1.0, 5.0, 0.0] И я хотел бы преобразовать его в следующий DataFrame: index | email | list _____________________________________________ 0 | email1@email.com | …

11
Разделение фрейма данных на несколько фреймов данных
У меня очень большой фрейм данных (около 1 миллиона строк) с данными эксперимента (60 респондентов). Я хотел бы разбить фрейм данных на 60 фреймов данных (фрейм данных для каждого участника). В кадре данных dataесть переменная с именем 'name', которая является уникальным кодом для каждого участника. Я пробовал следующее, но ничего …

2
Объединение фреймов данных pandas по именам столбцов
У меня есть два фрейма данных со следующими именами столбцов: frame_1: event_id, date, time, county_ID frame_2: countyid, state Я хотел бы получить фрейм данных со следующими столбцами, присоединившись (слева) к county_ID = countyid: joined_dataframe event_id, date, time, county, state Я не могу понять, как это сделать, если столбцы, к которым …

5
Заменить все конкретные значения во фрейме данных
Имея фрейм данных, как мне заменить все конкретные значения во всех строках и столбцах. Скажем, например, я хочу заменить все пустые записи на NA's (без ввода позиций): df <- data.frame(list(A=c("", "xyz", "jkl"), B=c(12, "", 100))) A B 1 12 2 xyz 3 jkl 100 Ожидаемый результат: A B 1 NA …
90 r  dataframe  replace 

5
Создание фрейма данных pandas из элементов вложенного словаря
Предположим, у меня есть вложенный словарь user_dict со структурой: Уровень 1: UserId (длинное целое число) Уровень 2: Категория (строка) Уровень 3: разные атрибуты (числа с плавающей запятой, целые числа и т. Д.) Например, запись этого словаря будет: user_dict[12] = { "Category 1": {"att_1": 1, "att_2": "whatever"}, "Category 2": {"att_1": 23, …


Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.