программирование pandas

9

Как заменить NaN на предыдущие значения в pandas DataFrame?

Предположим, у меня есть DataFrame с некоторыми NaNs: >>> import pandas as pd >>> df = pd.DataFrame([[1, 2, 3], [4, None, None], [None, None, 9]]) >>> df 0 1 2 0 1 2 3 1 4 NaN NaN 2 NaN NaN 9 Что мне нужно сделать, так это заменить each …

141 python python-3.x pandas dataframe nan

6

Панды read_csv из URL

Я использую Python 3.4 с IPython и имею следующий код. Я не могу прочитать csv-файл по указанному URL: import pandas as pd import requests url="https://github.com/cs109/2014_data/blob/master/countries.csv" s=requests.get(url).content c=pd.read_csv(s) У меня следующая ошибка «Ожидаемый путь к файлу или файлоподобный объект, полученный тип» Как я могу это исправить?

139 python csv pandas request

6

Панды: Настройка №. из макс строк

У меня проблема с просмотром следующего DataFrame: n = 100 foo = DataFrame(index=range(n)) foo['floats'] = np.random.randn(n) foo Проблема заключается в том, что он не печатает все строки по умолчанию в записной книжке ipython, но мне нужно нарезать, чтобы просмотреть результирующие строки. Даже следующая опция не меняет вывод: pd.set_option('display.max_rows', 500) Кто-нибудь …

138 python formatting pandas ipython-notebook

7

Найти столбец, имя которого содержит определенную строку

У меня есть фрейм данных с именами столбцов, и я хочу найти тот, который содержит определенную строку, но не совсем соответствует ей. Я ищу 'spike'в именах столбцов нравятся 'spike-2', 'hey spike', 'spiked-in'( 'spike'часть всегда непрерывна). Я хочу, чтобы имя столбца возвращалось в виде строки или переменной, поэтому я обращусь к …

138 python python-3.x string pandas dataframe

6

масштабирование столбцов в пандах с помощью sklearn

У меня есть фреймворк pandas со столбцами смешанного типа, и я хотел бы применить min_max_scaler sklearn к некоторым столбцам. В идеале я хотел бы выполнить эти преобразования на месте, но еще не придумал, как это сделать. Я написал следующий код, который работает: import pandas as pd import numpy as np …

138 python pandas scikit-learn dataframe

4

Каков наиболее эффективный способ создать словарь из двух столбцов pandas Dataframe?

Каков наиболее эффективный способ организовать следующий фрейм данных pandas: данные = Position Letter 1 a 2 b 3 c 4 d 5 e в словарь вроде alphabet[1 : 'a', 2 : 'b', 3 : 'c', 4 : 'd', 5 : 'e']?

138 python dictionary pandas dataframe

5

Фреймворк Pandas получает первую строку каждой группы

У меня есть DataFrameтакие панды, как следующие. df = pd.DataFrame({'id' : [1,1,1,2,2,3,3,3,3,4,4,5,6,6,6,7,7], 'value' : ["first","second","second","first", "second","first","third","fourth", "fifth","second","fifth","first", "first","second","third","fourth","fifth"]}) Я хочу сгруппировать это по ["id", "value"] и получить первую строку каждой группы. id value 0 1 first 1 1 second 2 1 second 3 2 first 4 2 second 5 3 …

137 python pandas dataframe

4

Проблема с соединением Pandas: столбцы перекрываются, но не указан суффикс

У меня есть следующие 2 фрейма данных: df_a = mukey DI PI 0 100000 35 14 1 1000005 44 14 2 1000006 44 14 3 1000007 43 13 4 1000008 43 13 df_b = mukey niccdcd 0 190236 4 1 190237 6 2 190238 7 3 190239 4 4 190240 …

137 python join pandas

6

Как я могу сопоставить True / False с 1/0 в Pandas DataFrame?

У меня есть столбец в Python pandas DataFrame, который имеет логические значения True / False, но для дальнейших вычислений мне нужно представление 1/0. Есть ли быстрый способ сделать это с помощью pandas / numpy?

136 python numpy pandas

6

Как загрузить файл tsv в фрейм данных Pandas?

Я новичок в питоне и пандах. Я пытаюсь tsvзагрузить файл в панда DataFrame. Вот что я пытаюсь и получаю ошибку: >>> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t')) Traceback (most recent call last): File "<pyshell#28>", line 1, in <module> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t')) File "C:\Python27\lib\site-packages\pandas\core\frame.py", line 318, in __init__ raise PandasError('DataFrame constructor not …

136 python pandas csv

10

ImportError: нет модуля с именем dateutil.parser

При импорте pandasв Pythonпрограмму я получаю следующую ошибку monas-mbp:book mona$ sudo pip install python-dateutil Requirement already satisfied (use --upgrade to upgrade): python-dateutil in /System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python Cleaning up... monas-mbp:book mona$ python t1.py No module named dateutil.parser Traceback (most recent call last): File "t1.py", line 4, in <module> import pandas as pd File …

136 python pandas pip

6

Панды: Как разделить текст в столбце на несколько строк?

Я работаю с большим CSV-файлом, и рядом с последним столбцом есть строка текста, которую я хочу разделить по определенному разделителю. Мне было интересно, если есть простой способ сделать это с помощью панд или питона? CustNum CustomerName ItemQty Item Seatblocks ItemExt 32363 McCartney, Paul 3 F04 2:218:10:4,6 60 31316 Lennon, John …

135 python pandas dataframe

8

Панды разделяют столбец списков на несколько столбцов

У меня есть DataFrame pandas с одним столбцом: import pandas as pd df = pd.DataFrame( data={ "teams": [ ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ] } ) print(df) Вывод: teams 0 [SF, NYG] 1 [SF, NYG] 2 [SF, NYG] 3 [SF, NYG] …

135 python pandas

10

Панды конвертируют фрейм данных в массив кортежей

Я обработал некоторые данные с помощью панд, и теперь я хочу выполнить пакетное сохранение обратно в базу данных. Это требует, чтобы я преобразовал фрейм данных в массив кортежей, причем каждый кортеж соответствует «строке» фрейма данных. Мой DataFrame выглядит примерно так: In [182]: data_set Out[182]: index data_date data_1 data_2 0 14303 …

135 python pandas

3

pandas: несколько условий при индексировании фрейма данных - неожиданное поведение

Я фильтрую строки в кадре данных по значениям в двух столбцах. По какой-то причине оператор ИЛИ ведет себя так, как я ожидал, что оператор И будет вести себя, и наоборот. Мой тестовый код: import pandas as pd df = pd.DataFrame({'a': range(5), 'b': range(5) }) # let's insert some -1 values …

135 python pandas boolean-logic

Вопросы с тегом «pandas»