Вопросы с тегом «dataframe»

Фрейм данных является табличной структурой данных. Обычно он содержит данные, где строки - это наблюдения, а столбцы - переменные различных типов. В то время как «фрейм данных» или «фрейм данных» - это термин, используемый для этой концепции в нескольких языках (R, Apache Spark, deedle, Maple, библиотека pandas в Python и библиотека DataFrames в Julia), «таблица» - это термин, используемый в MATLAB и SQL.

20
Установите значение для конкретной ячейки в панде DataFrame, используя индекс
Я создал Pandas DataFrame df = DataFrame(index=['A','B','C'], columns=['x','y']) и получил это ху NaN NaN B NaN NaN C NaN NaN Затем я хочу присвоить значение определенной ячейке, например, для строки «C» и столбца «x». Я ожидал получить такой результат: ху NaN NaN B NaN NaN C 10 NaN с этим …
479 python  pandas  dataframe 

10
Разница между картой, applymap и методами применения в Pandas
Можете ли вы сказать мне, когда использовать эти методы векторизации с основными примерами? Я вижу, что mapэто Seriesметод, а остальные DataFrameметоды. Я запутался applyи в applymapметодах, хотя. Почему у нас есть два метода для применения функции к DataFrame? Опять же, простые примеры, которые иллюстрируют использование было бы здорово!


24
Как посчитать значения NaN в столбце в панде DataFrame
У меня есть данные, в которых я хочу найти число NaN, так что, если оно меньше некоторого порога, я опущу эти столбцы. Я посмотрел, но не смог найти никакой функции для этого. есть value_counts, но это будет медленно для меня, потому что большинство значений различны, и я хочу NaNтолько подсчет …
464 python  pandas  dataframe 

5
Создание пустого DataFrame Pandas, а затем его заполнение?
Я начинаю с документов панд DataFrame здесь: http://pandas.pydata.org/pandas-docs/stable/dsintro.html Я хотел бы итеративно заполнять DataFrame значениями для расчета временных рядов. В общем, я бы хотел инициализировать DataFrame столбцами A, B и строками отметок времени, все 0 или все NaN. Затем я добавляю начальные значения и просматриваю эти данные, вычисляя новую строку …
463 python  dataframe  pandas 

12
Как я могу заменить все значения NaN на нули в столбце кадра данных pandas?
У меня есть датафрейм, как показано ниже itm Date Amount 67 420 2012-09-30 00:00:00 65211 68 421 2012-09-09 00:00:00 29424 69 421 2012-09-16 00:00:00 29877 70 421 2012-09-23 00:00:00 30990 71 421 2012-09-30 00:00:00 61303 72 485 2012-09-09 00:00:00 71781 73 485 2012-09-16 00:00:00 NaN 74 485 2012-09-23 00:00:00 11072 …
458 python  pandas  dataframe 


11
Выделение частичной строкой в ​​панде DataFrame
У меня есть DataFrameс 4 столбцами, из которых 2 содержат строковые значения. Мне было интересно, если есть способ выбрать строки на основе частичного совпадения строк с конкретным столбцом? Другими словами, функция или лямбда-функция, которая будет делать что-то вроде re.search(pattern, cell_in_question) возвращая логическое значение. Я знаком с синтаксисом, df[df['A'] == "hello …


7
Получить статистику для каждой группы (например, количество, среднее и т. Д.), Используя pandas GroupBy?
У меня есть фрейм данных, dfи я использую несколько столбцов из него, чтобы groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() Таким образом, я почти получаю таблицу (фрейм данных), которая мне нужна. Чего не хватает, так это дополнительного столбца, который содержит количество строк в каждой группе. Другими словами, я имею в виду, но я также хотел …

7
Как отфильтровать данные Pandas, используя 'in' и 'not in', как в SQL
Как я могу достичь эквивалентов SQL INи NOT IN? У меня есть список с необходимыми значениями. Вот сценарий: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = ['UK','China'] # pseudo-code: df[df['countries'] not in countries] Мой текущий способ сделать это заключается в следующем: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = pd.DataFrame({'countries':['UK','China'], 'matched':True}) # IN df.merge(countries,how='inner',on='countries') # NOT …

18
UnicodeDecodeError при чтении CSV-файла в Pandas с Python
Я запускаю программу, которая обрабатывает 30 000 похожих файлов. Случайное число из них останавливается и выдает эту ошибку ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 608, …

15
Импортируйте несколько CSV-файлов в панды и объединяйте их в один DataFrame
Я хотел бы прочитать несколько CSV-файлов из каталога в панды и объединить их в один большой DataFrame. Я не был в состоянии понять это все же. Вот что у меня так далеко: import glob import pandas as pd # get data file names path =r'C:\DRO\DCL_rawdata_files' filenames = glob.glob(path + "/*.csv") …

16
Изменение имен столбцов фрейма данных
У меня есть фрейм данных с именем «newprice» (см. Ниже), и я хочу изменить имена столбцов в моей программе на R. > newprice Chang. Chang. Chang. 1 100 36 136 2 120 -33 87 3 150 14 164 На самом деле это то, что я делаю: names(newprice)[1]<-paste("premium") names(newprice)[2]<-paste("change") names(newprice)[3]<-paste("newprice") Я …
400 r  dataframe  rename 

6
Выбор ряда серий / данных панд по целочисленному индексу
Мне любопытно, почему df[2]не поддерживается, пока df.ix[2]и df[2:3]работают оба. In [26]: df.ix[2] Out[26]: A 1.027680 B 1.514210 C -1.466963 D -0.162339 Name: 2000-01-03 00:00:00 In [27]: df[2:3] Out[27]: A B C D 2000-01-03 1.02768 1.51421 -1.466963 -0.162339 Я ожидал df[2]бы работать так же, как и df[2:3]в соответствии с соглашением об …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.