Вопросы с тегом «dataframe»

Фрейм данных является табличной структурой данных. Обычно он содержит данные, где строки - это наблюдения, а столбцы - переменные различных типов. В то время как «фрейм данных» или «фрейм данных» - это термин, используемый для этой концепции в нескольких языках (R, Apache Spark, deedle, Maple, библиотека pandas в Python и библиотека DataFrames в Julia), «таблица» - это термин, используемый в MATLAB и SQL.


9
Название или название столбца индекса панд
Как я могу получить имя столбца индекса в пандах Python? Вот пример кадра данных: Column 1 Index Title Apples 1 Oranges 2 Puppies 3 Ducks 4 Я пытаюсь получить / установить заголовок индекса данных. Вот что я попробовал: import pandas as pd data = {'Column 1' : [1., 2., 3., …

15
Разделить столбец строки фрейма данных на несколько столбцов
Я хотел бы взять данные формы before = data.frame(attr = c(1,30,4,6), type=c('foo_and_bar','foo_and_bar_2')) attr type 1 1 foo_and_bar 2 30 foo_and_bar_2 3 4 foo_and_bar 4 6 foo_and_bar_2 и используйте split()столбец " type" сверху, чтобы получить что-то вроде этого: attr type_1 type_2 1 1 foo bar 2 30 foo bar_2 3 4 …
246 r  string  dataframe  split  r-faq 

6
Почему не работает моя функция «Применить», относящаяся к нескольким столбцам? [закрыто]
Закрыто. Этот вопрос не воспроизводится или был вызван опечатками . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме переполнения стека. Закрыто в прошлом году . Улучшить этот вопрос У меня есть некоторые проблемы с функцией применения Pandas при использовании нескольких столбцов …


12
Панды получают строки, которых нет в другом фрейме данных
У меня есть два фрейма данных панд, у которых есть несколько общих строк. Предположим, dataframe2 является подмножеством dataframe1. Как я могу получить строки dataframe1, которых нет в dataframe2? df1 = pandas.DataFrame(data = {'col1' : [1, 2, 3, 4, 5], 'col2' : [10, 11, 12, 13, 14]}) df2 = pandas.DataFrame(data = …
230 python  pandas  dataframe 

19
Нормализовать столбцы панд данных
У меня есть датафрейм в пандах, где каждый столбец имеет различный диапазон значений. Например: ДФ: A B C 1000 10 0.5 765 5 0.35 800 7 0.09 Любая идея, как я могу нормализовать столбцы этого кадра данных, где каждое значение находится между 0 и 1? Мой желаемый результат: A B …



8
Обновите фрейм данных в пандах, повторяя построчно
У меня есть фрейм данных панд, который выглядит следующим образом (это довольно большой) date exer exp ifor mat 1092 2014-03-17 American M 528.205 2014-04-19 1093 2014-03-17 American M 528.205 2014-04-19 1094 2014-03-17 American M 528.205 2014-04-19 1095 2014-03-17 American M 528.205 2014-04-19 1096 2014-03-17 American M 528.205 2014-05-17 Теперь я …

7
В чем разница между объединением и слиянием в пандах?
Предположим, у меня есть два DataFrames, например, так: left = pd.DataFrame({'key1': ['foo', 'bar'], 'lval': [1, 2]}) right = pd.DataFrame({'key2': ['foo', 'bar'], 'rval': [4, 5]}) Я хочу объединить их, поэтому я пытаюсь что-то вроде этого: pd.merge(left, right, left_on='key1', right_on='key2') И я счастлив key1 lval key2 rval 0 foo 1 foo 4 …
208 python  pandas  dataframe  join 


13
Как отобразить содержимое полного столбца в кадре данных Spark?
Я использую spark-CSV для загрузки данных в DataFrame. Я хочу сделать простой запрос и отобразить содержимое: val df = sqlContext.read.format("com.databricks.spark.csv").option("header", "true").load("my.csv") df.registerTempTable("tasks") results = sqlContext.sql("select col from tasks"); results.show() Col кажется усеченным: scala> results.show(); +--------------------+ | col| +--------------------+ |2015-11-16 07:15:...| |2015-11-16 07:15:...| |2015-11-16 07:15:...| |2015-11-16 07:15:...| |2015-11-16 07:15:...| |2015-11-16 07:15:...| …

20
Разбить (взорвать) строку ввода в панде в кадре данных на отдельные строки
У меня есть, pandas dataframeв котором один столбец текстовых строк содержит значения, разделенные запятыми. Я хочу разделить каждое поле CSV и создать новую строку для каждой записи (предположим, что CSV чисты и должны быть разделены только на ','). Например, aдолжно стать b: In [7]: a Out[7]: var1 var2 0 a,b,c …

17
Обнаружение и исключение выбросов в кадре данных Pandas
У меня есть фрейм данных панд с несколькими столбцами. Теперь я знаю, что определенные строки являются выбросами на основе определенного значения столбца. Например столбец 'Vol' имеет все значения вокруг, 12xxи одно значение 4000(выброс). Теперь я хотел бы исключить те строки, которые имеют Volтакой столбец. Итак, по сути, мне нужно поместить …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.