Вопросы с тегом «dataframe»

Фрейм данных является табличной структурой данных. Обычно он содержит данные, где строки - это наблюдения, а столбцы - переменные различных типов. В то время как «фрейм данных» или «фрейм данных» - это термин, используемый для этой концепции в нескольких языках (R, Apache Spark, deedle, Maple, библиотека pandas в Python и библиотека DataFrames в Julia), «таблица» - это термин, используемый в MATLAB и SQL.

13
Как удалить строки Pandas DataFrame, значение которых в определенном столбце равно NaN
Я имею это DataFrameи хочу только записи, EPSстолбец которых не NaN: >>> df STK_ID EPS cash STK_ID RPT_Date 601166 20111231 601166 NaN NaN 600036 20111231 600036 NaN 12 600016 20111231 600016 4.3 NaN 601009 20111231 601009 NaN NaN 601939 20111231 601939 2.5 NaN 000001 20111231 000001 NaN NaN ... то …
754 python  pandas  dataframe  nan 


7
Запись DataFrame для панд в файл CSV
У меня есть данные в пандах, которые я хотел бы записать в файл CSV. Я делаю это с помощью: df.to_csv('out.csv') И получаю ошибку: UnicodeEncodeError: 'ascii' codec can't encode character u'\u03b1' in position 20: ordinal not in range(128) Есть ли способ обойти это легко (то есть у меня есть символы Юникода …
717 python  csv  pandas  dataframe 

8
Конвертировать список словарей в панду DataFrame
У меня есть список словарей, как это: [{'points': 50, 'time': '5:00', 'year': 2010}, {'points': 25, 'time': '6:00', 'month': "february"}, {'points':90, 'time': '9:00', 'month': 'january'}, {'points_h1':20, 'month': 'june'}] И я хочу превратить это в панд, DataFrameкак это: month points points_h1 time year 0 NaN 50 NaN 5:00 2010 1 february 25 …

10
Довольно распечатать всю серию Pandas / DataFrame
Я много работаю с Series и DataFrames на терминале. По умолчанию __repr__для серии возвращается уменьшенная выборка с некоторыми значениями головы и хвоста, но остальные отсутствуют. Есть ли встроенный способ красивой печати всей серии / DataFrame? В идеале, он будет поддерживать правильное выравнивание, возможно, границы между столбцами, и, возможно, даже цветовое …
655 python  pandas  dataframe 

3
Чем отличаются iloc, ix и loc?
Может кто-нибудь объяснить, чем эти три метода нарезки отличаются? Я видел документы , и я видел эти ответы , но я все еще не могу объяснить, чем они отличаются. Мне они кажутся взаимозаменяемыми в значительной степени, потому что они находятся на более низких уровнях нарезки. Например, скажем, мы хотим получить …

15
Как бороться с SettingWithCopyWarning в Pandas?
Фон Я только что обновил свои панды с 0.11 до 0.13.0rc1. Теперь приложение выдает много новых предупреждений. Один из них, как это: E:\FinReporter\FM_EXT.py:449: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame. Try using .loc[row_index,col_indexer] = value instead quote_df['TVol'] = quote_df['TVol']/TVOL_SCALE Я …

14
Уровни коэффициента отбрасывания в заданном кадре данных
У меня есть фрейм данных, содержащий factor. Когда я создаю подмножество этого subsetфрейма данных, используя или другую функцию индексации, создается новый фрейм данных. Однако factorпеременная сохраняет все свои исходные уровни, даже если / если они не существуют в новом кадре данных. Это вызывает проблемы при выполнении граненых графиков или при …
543 r  dataframe  r-factor  r-faq 

12
Разница между скобками [] и двойными скобками [[]] для доступа к элементам списка или фрейма данных
R предоставляет два разных метода для доступа к элементам списка или data.frame: []и [[]]. В чем разница между этими двумя, в каких ситуациях я должен использовать один над другим?
521 r  list  dataframe  extract  r-faq 

20
Преобразовать список во фрейм данных
У меня есть вложенный список данных. Его длина составляет 132, а каждый элемент представляет собой список длиной 20. Существует ли быстрый способ преобразовать эту структуру во фрейм данных, содержащий 132 строки и 20 столбцов данных? Вот некоторые примеры данных для работы: l <- replicate( 132, list(sample(letters, 20)), simplify = FALSE …
513 r  list  dataframe 

11
Быстрое чтение очень больших таблиц как данных
У меня есть очень большие таблицы (30 миллионов строк), которые я хотел бы загрузить в виде фреймов данных в R. read.table()Имеет много удобных функций, но, похоже, в реализации много логики, которая может замедлить работу. В моем случае, я предполагаю, что знаю типы столбцов заранее, таблица не содержит заголовков столбцов или …
504 r  import  dataframe  r-faq 

9
Преобразование вывода Pandas GroupBy из Series в DataFrame
Я начинаю с входных данных, как это df1 = pandas.DataFrame( { "Name" : ["Alice", "Bob", "Mallory", "Mallory", "Bob" , "Mallory"] , "City" : ["Seattle", "Seattle", "Portland", "Seattle", "Seattle", "Portland"] } ) Который при печати выглядит так: City Name 0 Seattle Alice 1 Seattle Bob 2 Portland Mallory 3 Seattle Mallory …


21
Как проверить, является ли какое-либо значение NaN в Pandas DataFrame
В Python Pandas, как лучше всего проверить, имеет ли DataFrame одно (или несколько) значений NaN? Я знаю о функции pd.isnan, но это возвращает DataFrame логических значений для каждого элемента. Этот пост прямо здесь не совсем отвечает и на мой вопрос.
484 python  pandas  dataframe  nan 

16
Создать пустой data.frame
Я пытаюсь инициализировать data.frame без каких-либо строк. По сути, я хочу указать типы данных для каждого столбца и дать им имена, но в результате не нужно создавать никаких строк. Лучшее, что я смог сделать, это что-то вроде: df <- data.frame(Date=as.Date("01/01/2000", format="%m/%d/%Y"), File="", User="", stringsAsFactors=FALSE) df <- df[-1,] Который создает data.frame …
480 r  dataframe  r-faq 

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.