Вопросы с тегом «pandas»

Pandas - это библиотека Python для манипулирования и анализа данных, например, фреймов данных, многомерных временных рядов и наборов данных поперечного сечения, обычно встречающихся в статистике, результатах экспериментальной науки, эконометрике или финансах. Pandas - одна из основных библиотек данных в Python.

13
python-pandas и базы данных, такие как mysql
В документации к Pandas есть множество примеров лучших практик работы с данными, хранящимися в различных форматах. Однако я не могу найти хороших примеров для работы, например, с базами данных, такими как MySQL. Может ли кто-нибудь указать мне ссылки или дать несколько фрагментов кода о том, как эффективно преобразовать результаты запроса …
97 python  pandas 

4
Таблица частот для одной переменной
Последний вопрос новичков, панд на день: как мне создать таблицу для одной серии? Например: my_series = pandas.Series([1,2,2,3,3,3]) pandas.magical_frequency_function( my_series ) >> { 1 : 1, 2 : 2, 3 : 3 } Много поисков в Google привело меня к Series.describe () и pandas.crosstabs, но ни один из них не делает …

4
Как построить два столбца фрейма данных pandas с использованием точек?
У меня есть фрейм данных pandas, и я хотел бы построить значения из одного столбца по сравнению со значениями из другого столбца. К счастью, есть plotметод, связанный с фреймами данных, который, кажется, делает то, что мне нужно: df.plot(x='col_name_1', y='col_name_2') К сожалению, похоже, что среди стилей сюжета (перечисленных здесь после kindпараметра) …

1
Каковы аргументы «уровни», «ключи» и имена в функции concat Pandas?
Вопросы Как пользоваться pd.concat? Для чего levelsнужен аргумент? Для чего keysнужен аргумент? Есть несколько примеров, которые помогут объяснить, как использовать все аргументы? concatФункция Pandas - это швейцарский армейский нож сливающихся утилит. Разнообразие ситуаций, в которых она может быть полезна, велико. В существующей документации отсутствуют некоторые подробности некоторых дополнительных аргументов. Среди …
97 python  pandas 

5
В чем разница между NaN и None?
Я читаю два столбца файла csv, используя pandas, readcsv()а затем присваиваю значения словарю. Столбцы содержат строки цифр и букв. Иногда бывают случаи, когда ячейка пуста. На мой взгляд, значение, считываемое этой словарной статье, должно быть, Noneно вместо этого nanприсваивается. Конечно, Noneэто более наглядно для пустой ячейки, поскольку она имеет нулевое …
97 python  numpy  pandas  nan 

4
В чем разница между pandas.qcut и pandas.cut?
В документации говорится: http://pandas.pydata.org/pandas-docs/dev/basics.html «Непрерывные значения могут быть дискретизированы с использованием функций cut (интервалы на основе значений) и qcut (интервалы на основе выборочных квантилей)» Для меня это звучит очень абстрактно ... Я вижу различия в приведенном ниже примере, но что на самом деле означает / означает qcut (образец квантиля)? Когда …
97 python  pandas 



13
Перечислить самые высокие корреляционные пары из большой корреляционной матрицы в пандах?
Как найти верхние корреляции в корреляционной матрице с Pandas? Есть много ответов о том, как это сделать с R ( Показать корреляции в виде упорядоченного списка, а не в виде большой матрицы или Эффективный способ получить высококоррелированные пары из большого набора данных в Python или R ), но мне интересно, …

4
Строки в DataFrame, но dtype - это объект
Почему Pandas сообщает мне, что у меня есть объекты, хотя каждый элемент в выбранном столбце является строкой - даже после явного преобразования. Это мой DataFrame: <class 'pandas.core.frame.DataFrame'> Int64Index: 56992 entries, 0 to 56991 Data columns (total 7 columns): id 56992 non-null values attr1 56992 non-null values attr2 56992 non-null values …
96 python  pandas  numpy  types  series 

11
Найти целочисленный индекс строк с NaN в кадре данных pandas
У меня есть DataFrame панд вроде этого: a b 2011-01-01 00:00:00 1.883381 -0.416629 2011-01-01 01:00:00 0.149948 -1.782170 2011-01-01 02:00:00 -0.407604 0.314168 2011-01-01 03:00:00 1.452354 NaN 2011-01-01 04:00:00 -1.224869 -0.947457 2011-01-01 05:00:00 0.498326 0.070416 2011-01-01 06:00:00 0.401665 NaN 2011-01-01 07:00:00 -0.019766 0.533641 2011-01-01 08:00:00 -1.101303 -1.408561 2011-01-01 09:00:00 1.671795 -0.764629 Есть …
96 python  pandas 

12
В ноутбуке Jupyter две таблицы pandas расположены рядом
У меня есть два фрейма данных pandas, и я хотел бы отобразить их в блокноте Jupyter. Сделать что-то вроде: display(df1) display(df2) Показывает их одно под другим: Я хотел бы иметь второй фрейм данных справа от первого. Есть аналогичный вопрос , но похоже, что там человека устраивает либо объединение их в …

2
Обновить значения строк, в которых выполняется определенное условие в пандах
Скажем, у меня есть следующий фрейм данных: Каков наиболее эффективный способ обновить значения столбцов feat и another_feat, где поток имеет номер 2 ? Это все? for index, row in df.iterrows(): if df1.loc[index,'stream'] == 2: # do something ОБНОВЛЕНИЕ: что делать, если у меня более 100 столбцов? Я не хочу явно …

3
Как удалить пробелы из заголовков Pandas DataFrame?
Я анализирую данные из файла Excel, в заголовках некоторых столбцов которого есть лишние пробелы. Когда я проверяю столбцы полученного фрейма данных с помощью df.columns, я вижу: Index(['Year', 'Month ', 'Value']) ^ # Note the unwanted trailing space on 'Month ' Следовательно, я не могу: df["Month"] Потому что он скажет мне, …

6
Есть ли у pandas iterrows проблемы с производительностью?
Я заметил очень плохую производительность при использовании строк от панд. Это то, что переживают другие? Это специфично для iterrows, и следует ли избегать этой функции для данных определенного размера (я работаю с 2-3 миллионами строк)? Это обсуждение на GitHub привело меня к мысли, что это вызвано смешиванием dtypes в фрейме …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.