Вопросы с тегом «dataframe»

Фрейм данных является табличной структурой данных. Обычно он содержит данные, где строки - это наблюдения, а столбцы - переменные различных типов. В то время как «фрейм данных» или «фрейм данных» - это термин, используемый для этой концепции в нескольких языках (R, Apache Spark, deedle, Maple, библиотека pandas в Python и библиотека DataFrames в Julia), «таблица» - это термин, используемый в MATLAB и SQL.

6
Истинная ценность Серии неоднозначна. Используйте a.empty, a.bool (), a.item (), a.any () или a.all ()
Возникла проблема с фильтрацией моего результирующего кадра данных с orусловием. Я хочу, чтобы мой результат dfизвлекал все varзначения столбцов , которые выше 0,25 и ниже -0,25. Эта логика ниже дает мне неоднозначное значение истины, однако оно работает, когда я разделяю эту фильтрацию на две отдельные операции. Что здесь происходит? не …

15
Построение pandas DataFrame из значений в переменных дает «ValueError: Если вы используете все скалярные значения, вы должны передать индекс»
Это может быть простой вопрос, но я не могу понять, как это сделать. Допустим, у меня есть две переменные следующим образом. a = 2 b = 3 Я хочу построить DataFrame из этого: df2 = pd.DataFrame({'A':a,'B':b}) Это приводит к ошибке: ValueError: Если используются все скалярные значения, вы должны передать индекс …

12
Как применить функцию к двум столбцам Pandas dataframe
Предположим, у меня dfесть столбцы 'ID', 'col_1', 'col_2'. И я определяю функцию: f = lambda x, y : my_function_expression, Теперь я хочу , чтобы применить fк dfдвум колонкам «S 'col_1', 'col_2'для поэлементнога рассчитает новый столбец 'col_3', несколько как: df['col_3'] = df[['col_1','col_2']].apply(f) # Pandas gives : TypeError: ('<lambda>() takes exactly 2 …
369 python  pandas  dataframe 

10
Извлечение определенных столбцов из фрейма данных
У меня есть фрейм данных R с 6 столбцами, и я хочу создать новый фрейм данных, который имеет только три столбца. Предполагая , что мой кадр данных df, и я хочу , чтобы извлечь колонны A, Bи Eэто единственная команда , которую я могу понять: data.frame(df$A,df$B,df$E) Есть ли более компактный …
366 r  dataframe  r-faq 

15
Как суммировать переменную по группе
У меня есть фрейм данных с двумя столбцами. Первый столбец содержит категории, такие как «Первый», «Второй», «Третий», а второй столбец содержит числа, которые представляют количество раз, когда я видел определенные группы из «Категории». Например: Category Frequency First 10 First 15 First 5 Second 2 Third 14 Third 20 Second 3 …
357 r  dataframe  aggregate  r-faq 


11
Как получить значение из ячейки информационного кадра?
Я построил условие, которое извлекает ровно одну строку из моего фрейма данных: d2 = df[(df['l_ext']==l_ext) & (df['item']==item) & (df['wn']==wn) & (df['wd']==1)] Теперь я хотел бы взять значение из определенного столбца: val = d2['col_name'] Но в результате я получаю фрейм данных, который содержит одну строку и один столбец ( то есть …
347 python  pandas  dataframe 

9
Преобразовать список фреймов данных в один фрейм данных
У меня есть код, который в одном месте заканчивается списком фреймов данных, которые я действительно хочу преобразовать в один большой фрейм данных. Я получил несколько советов из предыдущего вопроса, который пытался сделать что-то похожее, но более сложное. Вот пример того, с чего я начинаю (это сильно упрощено для иллюстрации): listOfDataFrames …
336 list  r  dataframe 


14
Панды: фильтровать строки DataFrame с оператором цепочки
Большинство операций в pandasможет быть выполнены с помощью оператора цепочки ( groupby, aggregate, apply, и т.д.), но единственным способом я нашел для фильтра строк с помощью обычной индексации кронштейна df_filtered = df[df['column'] == value] Это непривлекательно, так как требует, чтобы я присвоил dfпеременную, прежде чем смогу фильтровать ее значения. Есть …
329 python  pandas  dataframe 


23
Как создать тестовые и обучающие образцы из одного кадра данных с пандами?
У меня есть довольно большой набор данных в виде фрейма данных, и мне было интересно, как я смогу разделить фрейм данных на две случайные выборки (80% и 20%) для обучения и тестирования. Спасибо!

7
Панды read_csv low_memory и опции dtype
При звонке df = pd.read_csv('somefile.csv') Я получил: /Users/josh/anaconda/envs/py27/lib/python2.7/site-packages/pandas/io/parsers.py:1130: DtypeWarning: столбцы (4,5,7,16) имеют смешанные типы. Укажите опцию dtype при импорте или установите low_memory = False. Почему этот dtypeвариант связан с этим low_memoryи почему он Falseпоможет решить эту проблему?

11
Как хранить данные с помощью Pandas
Прямо сейчас я импортирую довольно большой CSVфайл данных каждый раз, когда запускаю скрипт. Есть ли хорошее решение для того, чтобы держать этот фрейм данных постоянно доступным между запусками, чтобы мне не пришлось тратить все это время на ожидание запуска скрипта?
317 python  pandas  dataframe 

8
Pandas условное создание столбца серии / dataframe
У меня есть датафрейм по линии ниже: Type Set 1 A Z 2 B Z 3 B X 4 C Y Я хочу добавить еще один столбец к фрейму данных (или сгенерировать серию) той же длины, что и фрейм данных (= равное количество записей / строк), который устанавливает зеленый цвет, …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.