Вопросы с тегом «pandas»

Pandas - это библиотека Python для манипулирования и анализа данных, например, фреймов данных, многомерных временных рядов и наборов данных поперечного сечения, обычно встречающихся в статистике, результатах экспериментальной науки, эконометрике или финансах. Pandas - одна из основных библиотек данных в Python.


6
Панды read_csv из URL
Я использую Python 3.4 с IPython и имею следующий код. Я не могу прочитать csv-файл по указанному URL: import pandas as pd import requests url="https://github.com/cs109/2014_data/blob/master/countries.csv" s=requests.get(url).content c=pd.read_csv(s) У меня следующая ошибка «Ожидаемый путь к файлу или файлоподобный объект, полученный тип» Как я могу это исправить?
139 python  csv  pandas  request 

6
Панды: Настройка №. из макс строк
У меня проблема с просмотром следующего DataFrame: n = 100 foo = DataFrame(index=range(n)) foo['floats'] = np.random.randn(n) foo Проблема заключается в том, что он не печатает все строки по умолчанию в записной книжке ipython, но мне нужно нарезать, чтобы просмотреть результирующие строки. Даже следующая опция не меняет вывод: pd.set_option('display.max_rows', 500) Кто-нибудь …

7
Найти столбец, имя которого содержит определенную строку
У меня есть фрейм данных с именами столбцов, и я хочу найти тот, который содержит определенную строку, но не совсем соответствует ей. Я ищу 'spike'в именах столбцов нравятся 'spike-2', 'hey spike', 'spiked-in'( 'spike'часть всегда непрерывна). Я хочу, чтобы имя столбца возвращалось в виде строки или переменной, поэтому я обращусь к …

6
масштабирование столбцов в пандах с помощью sklearn
У меня есть фреймворк pandas со столбцами смешанного типа, и я хотел бы применить min_max_scaler sklearn к некоторым столбцам. В идеале я хотел бы выполнить эти преобразования на месте, но еще не придумал, как это сделать. Я написал следующий код, который работает: import pandas as pd import numpy as np …


5
Фреймворк Pandas получает первую строку каждой группы
У меня есть DataFrameтакие панды, как следующие. df = pd.DataFrame({'id' : [1,1,1,2,2,3,3,3,3,4,4,5,6,6,6,7,7], 'value' : ["first","second","second","first", "second","first","third","fourth", "fifth","second","fifth","first", "first","second","third","fourth","fifth"]}) Я хочу сгруппировать это по ["id", "value"] и получить первую строку каждой группы. id value 0 1 first 1 1 second 2 1 second 3 2 first 4 2 second 5 3 …
137 python  pandas  dataframe 



6
Как загрузить файл tsv в фрейм данных Pandas?
Я новичок в питоне и пандах. Я пытаюсь tsvзагрузить файл в панда DataFrame. Вот что я пытаюсь и получаю ошибку: >>> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t')) Traceback (most recent call last): File "<pyshell#28>", line 1, in <module> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t')) File "C:\Python27\lib\site-packages\pandas\core\frame.py", line 318, in __init__ raise PandasError('DataFrame constructor not …
136 python  pandas  csv 

10
ImportError: нет модуля с именем dateutil.parser
При импорте pandasв Pythonпрограмму я получаю следующую ошибку monas-mbp:book mona$ sudo pip install python-dateutil Requirement already satisfied (use --upgrade to upgrade): python-dateutil in /System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python Cleaning up... monas-mbp:book mona$ python t1.py No module named dateutil.parser Traceback (most recent call last): File "t1.py", line 4, in <module> import pandas as pd File …
136 python  pandas  pip 

6
Панды: Как разделить текст в столбце на несколько строк?
Я работаю с большим CSV-файлом, и рядом с последним столбцом есть строка текста, которую я хочу разделить по определенному разделителю. Мне было интересно, если есть простой способ сделать это с помощью панд или питона? CustNum CustomerName ItemQty Item Seatblocks ItemExt 32363 McCartney, Paul 3 F04 2:218:10:4,6 60 31316 Lennon, John …
135 python  pandas  dataframe 


10
Панды конвертируют фрейм данных в массив кортежей
Я обработал некоторые данные с помощью панд, и теперь я хочу выполнить пакетное сохранение обратно в базу данных. Это требует, чтобы я преобразовал фрейм данных в массив кортежей, причем каждый кортеж соответствует «строке» фрейма данных. Мой DataFrame выглядит примерно так: In [182]: data_set Out[182]: index data_date data_1 data_2 0 14303 …
135 python  pandas 

3
pandas: несколько условий при индексировании фрейма данных - неожиданное поведение
Я фильтрую строки в кадре данных по значениям в двух столбцах. По какой-то причине оператор ИЛИ ведет себя так, как я ожидал, что оператор И будет вести себя, и наоборот. Мой тестовый код: import pandas as pd df = pd.DataFrame({'a': range(5), 'b': range(5) }) # let's insert some -1 values …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.