Вопросы с тегом «dataframe»

Фрейм данных является табличной структурой данных. Обычно он содержит данные, где строки - это наблюдения, а столбцы - переменные различных типов. В то время как «фрейм данных» или «фрейм данных» - это термин, используемый для этой концепции в нескольких языках (R, Apache Spark, deedle, Maple, библиотека pandas в Python и библиотека DataFrames в Julia), «таблица» - это термин, используемый в MATLAB и SQL.

3
Медленные панды DataFrame MultiIndex Reindex
У меня есть панды DataFrame в форме: id start_time sequence_no value 0 71 2018-10-17 20:12:43+00:00 114428 3 1 71 2018-10-17 20:12:43+00:00 114429 3 2 71 2018-10-17 20:12:43+00:00 114431 79 3 71 2019-11-06 00:51:14+00:00 216009 100 4 71 2019-11-06 00:51:14+00:00 216011 150 5 71 2019-11-06 00:51:14+00:00 216013 180 6 92 2019-12-01 …

1
Как поворачивать фрейм данных, состоящий из столбца с разделом и подразделом в R
У меня есть нижеупомянутый фрейм данных: structure( list(ID = c("P-1", " P-1", "P-1", "P-2", "P-3", "P-4", "P-5", "P-6", "P-7", "P-8"), Date = c("2020-03-16 12:11:33", "2020-03-16 13:16:04", "2020-03-16 06:13:55", "2020-03-16 10:03:43", "2020-03-16 12:37:09", "2020-03-16 06:40:24", "2020-03-16 09:46:45", "2020-03-16 12:07:44", "2020-03-16 14:09:51", "2020-03-16 09:19:23"), Status = c("SA", "SA", "SA", "RE", "RE", "RE", …

2
Генерация отфильтрованных бинарных декартовых продуктов
Постановка задачи Я ищу эффективный способ генерирования полных двоичных декартовых продуктов (таблиц со всеми комбинациями True и False с определенным числом столбцов), отфильтрованных по определенным исключительным условиям. Например, для трех столбцов / битов n=3мы получили бы полную таблицу df_combs = pd.DataFrame(itertools.product(*([[True, False]] * n))) 0 1 2 0 True True …

5
Добавить идентификатор, найденный в списке, в новый столбец в панде.
Скажем, у меня есть следующий фрейм данных (столбец целых чисел и столбец со списком целых чисел) ... ID Found_IDs 0 12345 [15443, 15533, 3433] 1 15533 [2234, 16608, 12002, 7654] 2 6789 [43322, 876544, 36789] А также отдельный список идентификаторов ... bad_ids = [15533, 876544, 36789, 11111] Учитывая это, и …

1
Как удалить нулевые значения из динамического цикла, сгенерированного из Python?
У меня есть фрейм данных, как это: ORDER_NO 2401 2504 2600 2020020 2019-12-04 2019-12-10 2019-12-12 2020024 2019-12-25 NaN 2019-12-20 2020034 NaN NaN 2019-12-20 2020020 2019-12-12 2019-12-15 2019-12-18 Я создаю XML из вышеупомянутого фрейма данных. Я хочу удалить нулевое значение в XML. Мой код должен удалить этот конкретный столбец и значение …

6
идентифицировать и пометить повторяющиеся строки в r
Я хотел бы идентифицировать и отметить повторяющиеся строки на основе 2 столбцов. Я хотел бы сделать уникальный идентификатор для каждого дубликата, чтобы я знал не только, что строка является дубликатом, но и с какой строкой он является дубликатом. У меня есть датафрейм, который выглядит как показано ниже, с некоторыми дублирующимися …
11 r  dataframe 

7
Считать файл повторяющихся пар «ключ = значение» в DataFrame
У меня есть текстовый файл с данными в этом формате. Первые 3 строки повторяются снова и снова. name=1 grade=A class=B name=2 grade=D class=A Я хотел бы вывести данные в виде таблицы, например: name | grade | class 1 | A | B 2 | D | A Я изо всех …

6
объединить кадры данных на основе нескольких столбцов и порогов
У меня есть два data.frameS с несколькими общими столбцами (здесь: date, city, ctry, и ( other_) number). Теперь я хотел бы объединить их в приведенных выше столбцах, но допустил бы некоторые различия: threshold.numbers <- 3 threshold.date <- 5 # in days Если разница между dateзаписями составляет > threshold.date(в днях) или …
11 r  dataframe 


6
AttributeError: у объекта «DataFrame» нет атрибута «ix»
Я получаю сообщение об ошибке выше, когда пытаюсь использовать атрибут .ix для pandas dataframe, чтобы извлечь столбец, например, df.ix [:, 'col_header']. Сценарий работал с утра, но сегодня днем ​​я запустил его в новой среде Linux с новой установкой Pandas. Кто-нибудь еще видел эту ошибку раньше? Я искал здесь и в …

3
Расплавить только часть столбца из кадра данных панд
У меня есть следующий пример dataframe: df = pd.DataFrame(data = {'RecordID' : [1,1,1,1,1,2,2,2,2,3,3,3,3,4,4,4,4,5,5,5,5], 'DisplayLabel' : ['Source','Test','Value 1','Value 2','Value3','Source','Test','Value 1','Value 2','Source','Test','Value 1','Value 2','Source','Test','Value 1','Value 2','Source','Test','Value 1','Value 2'], 'Value' : ['Web','Logic','S','I','Complete','Person','Voice','>20','P','Mail','OCR','A','I','Dictation','Understandable','S','I','Web','Logic','R','S']}) который создает этот фрейм данных: +-------+----------+---------------+----------------+ | Index | RecordID | Display Label | Value | +-------+----------+---------------+----------------+ | 0 | 1 …

2
Как найти верхние N минимальных значений из DataFrame, Python-3
У меня ниже Dataframe с полем «Возраст», необходимо найти до 3-х минимальный возраст из DataFrame DF = pd.DataFrame.from_dict({'Name':['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'], 'Age':[18, 45, 35, 70, 23, 24, 50, 65, 18, 23]}) DF['Age'].min() Хотите топ два возраста, то есть 18, 23 в списке, как этого …

5
Создание нового столбца условно на основе предыдущих n строк
У меня есть фрейм данных, настроенный следующим образом: df <- data.frame("id" = c(111,111,111,222,222,222,222,333,333,333,333), "Location" = c("A","B","A","A","C","B","A","B","A","A","A"), "Encounter" = c(1,2,3,1,2,3,4,1,2,3,4)) id Location Encounter 1 111 A 1 2 111 B 2 3 111 A 3 4 222 A 1 5 222 C 2 6 222 B 3 7 222 A 4 …

1
объединить два кадра данных и добавить уровень столбца с именами
Привет! Я копался в методах concat, join и merge для панд и не могу найти то, что мне нужно. Предположим, у меня есть два кадра данных A = pd.DataFrame("A",index=[0,1,2,3,4],columns=['Col 1','Col 2','Col 3']) B = pd.DataFrame("B",index=[0,1,2,3,4],columns=['Col 1','Col 2','Col 3']) >>> A Col 1 Col 2 Col 3 0 A A A …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.