Вопросы с тегом «dataframe»

Фрейм данных является табличной структурой данных. Обычно он содержит данные, где строки - это наблюдения, а столбцы - переменные различных типов. В то время как «фрейм данных» или «фрейм данных» - это термин, используемый для этой концепции в нескольких языках (R, Apache Spark, deedle, Maple, библиотека pandas в Python и библиотека DataFrames в Julia), «таблица» - это термин, используемый в MATLAB и SQL.

6
Как кратко написать формулу с множеством переменных из фрейма данных?
Предположим, у меня есть переменная ответа и данные, содержащие три ковариаты (в качестве игрушечного примера): y = c(1,4,6) d = data.frame(x1 = c(4,-1,3), x2 = c(3,9,8), x3 = c(4,-4,-2)) Я хочу подобрать линейную регрессию к данным: fit = lm(y ~ d$x1 + d$x2 + d$y2) Есть ли способ написать формулу, …
127 r  dataframe  glm  lm 

4
Как сформировать столбец кортежа из двух столбцов в Pandas
У меня есть DataFrame Pandas, и я хочу объединить столбцы lat и long, чтобы сформировать кортеж. <class 'pandas.core.frame.DataFrame'> Int64Index: 205482 entries, 0 to 209018 Data columns: Month 205482 non-null values Reported by 205482 non-null values Falls within 205482 non-null values Easting 205482 non-null values Northing 205482 non-null values Location 205482 …

10
Сохранение Dataframe в CSV непосредственно в s3 Python
У меня есть DataFrame pandas, который я хочу загрузить в новый файл CSV. Проблема в том, что я не хочу сохранять файл локально перед переносом на s3. Есть ли какой-нибудь метод, например to_csv, для прямой записи фрейма данных в s3? Я использую boto3. Вот что у меня есть на данный …

2
Как создать DataFrame из случайных целых чисел с помощью Pandas?
Я знаю, что если я использую randn, import pandas as pd import numpy as np df = pd.DataFrame(np.random.randn(100, 4), columns=list('ABCD')) дает мне то, что я ищу, но с элементами нормального распределения. Но что, если мне просто нужны случайные целые числа? randintработает, предоставляя диапазон, но не массив, как это randnделает. Итак, …

12
data.frame строки в список
У меня есть data.frame, который я хотел бы преобразовать в список по строкам, то есть каждая строка будет соответствовать своим собственным элементам списка. Другими словами, мне нужен список, который будет содержать строки в data.frame. До сих пор я решал эту проблему следующим образом, но мне было интересно, есть ли лучший …
123 list  r  dataframe 

3
Найдите имя столбца, которое имеет максимальное значение для каждой строки
У меня есть такой DataFrame: In [7]: frame.head() Out[7]: Communications and Search Business General Lifestyle 0 0.745763 0.050847 0.118644 0.084746 0 0.333333 0.000000 0.583333 0.083333 0 0.617021 0.042553 0.297872 0.042553 0 0.435897 0.000000 0.410256 0.153846 0 0.358974 0.076923 0.410256 0.153846 Здесь я хочу спросить, как получить имя столбца, которое имеет …
123 python  pandas  dataframe  max 

8
Динамически выбирать столбцы фрейма данных с помощью $ и символьного значения
У меня есть вектор с разными именами столбцов, и я хочу иметь возможность перебирать каждый из них, чтобы извлечь этот столбец из data.frame. Например, рассмотрим набор данных mtcarsи некоторые имена переменных, хранящиеся в векторе символов cols. Когда я пытаюсь выбрать переменную из mtcarsдинамического подмножества cols, ни одна из этих работ …
122 r  dataframe  r-faq 

8
Как добавить несколько столбцов в фрейм данных pandas за одно задание?
Я новичок в пандах и пытаюсь понять, как одновременно добавить несколько столбцов в панды. Любая помощь здесь приветствуется. В идеале я хотел бы сделать это за один шаг, а не за несколько повторяющихся шагов ... import pandas as pd df = {'col_1': [0, 1, 2, 3], 'col_2': [4, 5, 6, …
122 python  pandas  dataframe 

7
Как добавить строки во фрейм данных R
Я просмотрел StackOverflow, но не могу найти решения, специфичного для моей проблемы, которое включает добавление строк во фрейм данных R. Я инициализирую пустой фрейм данных с двумя столбцами следующим образом. df = data.frame(x = numeric(), y = character()) Затем моя цель - перебрать список значений и на каждой итерации добавить …
121 r  merge  append  dataframe  rows 

3
получение индекса строки в функции применения панд
Я пытаюсь получить доступ к индексу строки в функции, применяемой ко всему DataFrameв Pandas. У меня примерно так: df = pandas.DataFrame([[1,2,3],[4,5,6]], columns=['a','b','c']) >>> df a b c 0 1 2 3 1 4 5 6 и я определю функцию, которая обращается к элементам с заданной строкой def rowFunc(row): return row['a'] …
121 python  pandas  dataframe 

14
Подсчитайте количество строк в каждой группе
У меня есть фрейм данных, и я хотел бы подсчитать количество строк в каждой группе. Я регулярно использую эту aggregateфункцию для суммирования данных следующим образом: df2 <- aggregate(x ~ Year + Month, data = df1, sum) Теперь я хотел бы посчитать наблюдения, но не могу найти подходящего аргумента FUN. Интуитивно …
121 r  dataframe  aggregate  r-faq 

11
Найдите максимальное значение столбца и верните соответствующие значения строки с помощью Pandas
Используя Python Pandas, я пытаюсь найти Country& Placeс максимальным значением. Это возвращает максимальное значение: data.groupby(['Country','Place'])['Value'].max() Но как мне получить соответствующее Countryи Placeимя?
121 python  pandas  dataframe  max 

14
Как разложить (взорвать) столбец в фрейме данных pandas?
У меня есть следующий DataFrame, в котором один из столбцов является объектом (ячейка типа списка): df=pd.DataFrame({'A':[1,2],'B':[[1,2],[1,2]]}) df Out[458]: A B 0 1 [1, 2] 1 2 [1, 2] Мой ожидаемый результат: A B 0 1 1 1 1 2 3 2 1 4 2 2 Что мне делать для этого? …
120 python  pandas  dataframe 

5
Передайте в функцию имя столбца data.frame.
Я пытаюсь написать функцию для приема data.frame ( x) и columnот нее. Функция выполняет некоторые вычисления для x и позже возвращает другой data.frame. Я застрял на передовом методе передачи имени столбца функции. Два минимальных примера fun1и fun2приведенные ниже дают желаемый результат, позволяя выполнять операции x$column, используя max()в качестве примера. Однако …
119 r  dataframe  r-faq 

1
Какие правила использует Pandas для создания представления или копии?
Я смущен правилами, которые использует Pandas, когда решает, что выбор из фрейма данных является копией исходного фрейма данных или представлением оригинала. Если у меня, например, df = pd.DataFrame(np.random.randn(8,8), columns=list('ABCDEFGH'), index=range(1,9)) Я понимаю, что a queryвозвращает копию, поэтому что-то вроде foo = df.query('2 < index <= 5') foo.loc[:,'E'] = 40 не …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.