Вопросы с тегом «pandas»

Pandas - это библиотека Python для манипулирования и анализа данных, например, фреймов данных, многомерных временных рядов и наборов данных поперечного сечения, обычно встречающихся в статистике, результатах экспериментальной науки, эконометрике или финансах. Pandas - одна из основных библиотек данных в Python.

7
получить список из столбца данных панд
У меня есть документ Excel, который выглядит следующим образом .. cluster load_date budget actual fixed_price A 1/1/2014 1000 4000 Y A 2/1/2014 12000 10000 Y A 3/1/2014 36000 2000 Y B 4/1/2014 15000 10000 N B 4/1/2014 12000 11500 N B 4/1/2014 90000 11000 N C 7/1/2014 22000 18000 N …
289 python  list  pandas 


8
Создание Pandas DataFrame из массива Numpy: как указать столбец индекса и заголовки столбцов?
У меня есть массив Numpy, состоящий из списка списков, представляющих двумерный массив с метками строк и именами столбцов, как показано ниже: data = array([['','Col1','Col2'],['Row1',1,2],['Row2',3,4]]) Я хотел бы, чтобы результирующий DataFrame имел Row1 и Row2 в качестве значений индекса, а Col1, Col2 в качестве значений заголовка Я могу указать индекс следующим …
281 python  pandas  numpy 

8
Как выбрать все столбцы, кроме одного столбца в пандах?
У меня датафрейм выглядит так: import pandas import numpy as np df = DataFrame(np.random.rand(4,4), columns = list('abcd')) df a b c d 0 0.418762 0.042369 0.869203 0.972314 1 0.991058 0.510228 0.594784 0.534366 2 0.407472 0.259811 0.396664 0.894202 3 0.726168 0.139531 0.324932 0.906575 Как я могу получить все столбцы, кроме column …
280 python  pandas 


6
Python Pandas: получить индекс строк, столбец которых соответствует определенному значению
Учитывая DataFrame со столбцом «BoolCol», мы хотим найти индексы DataFrame, в которых значения для «BoolCol» == True В настоящее время у меня есть итеративный способ сделать это, который отлично работает: for i in range(100,3000): if df.iloc[i]['BoolCol']== True: print i,df.iloc[i]['BoolCol'] Но это не правильный способ панды сделать это. После некоторых исследований …
278 python  indexing  pandas 

5
Создать Pandas DataFrame из строки
Чтобы протестировать некоторые функции, я хотел бы создать DataFrameстроку. Допустим, мои тестовые данные выглядят так: TESTDATA="""col1;col2;col3 1;4.4;99 2;4.5;200 3;4.7;65 4;3.2;140 """ Какой самый простой способ прочитать эти данные в панд DataFrame?

3
Как проверить, существует ли столбец в Пандах
Есть ли способ проверить, существует ли столбец в Pandas DataFrame? Предположим, что у меня есть следующий DataFrame: >>> import pandas as pd >>> from random import randint >>> df = pd.DataFrame({'A': [randint(1, 9) for x in xrange(10)], 'B': [randint(1, 9)*10 for x in xrange(10)], 'C': [randint(1, 9)*100 for x in …
275 python  pandas  dataframe 

11
Как сгруппировать строки данных в список в pandas groupby?
У меня есть фрейма данных панд, dfкак: a b A 1 A 2 B 5 B 5 B 4 C 6 Я хочу сгруппировать по первому столбцу и получить второй столбец в виде списков в строках : A [1,2] B [5,5,4] C [6] Можно ли сделать что-то подобное с помощью …

21
Что означает ось в пандах?
Вот мой код для генерации кадра данных: import pandas as pd import numpy as np dff = pd.DataFrame(np.random.randn(1,2),columns=list('AB')) тогда я получил датафрейм: +------------+---------+--------+ | | A | B | +------------+---------+--------- | 0 | 0.626386| 1.52325| +------------+---------+--------+ Когда я набираю команду: dff.mean(axis=1) Я получил : 0 1.074821 dtype: float64 Согласно ссылке …

10
Как взять столбцы-фрагменты данных в пандах
Я загружаю некоторые данные машинного обучения из файла CSV. Первые 2 столбца являются наблюдениями, а остальные столбцы - объектами. В настоящее время я делаю следующее: data = pandas.read_csv('mydata.csv') который дает что-то вроде: data = pandas.DataFrame(np.random.rand(10,5), columns = list('abcde')) Я хотел бы, чтобы нарезать это dataframe в двух dataframes: один , …



6
Панды: Как я могу использовать функцию apply () для одного столбца?
У меня есть кадр данных панд с двумя столбцами. Мне нужно изменить значения первого столбца, не затрагивая второй, и получить обратно весь фрейм данных только с измененными значениями первого столбца. Как я могу сделать это, используя apply в пандах?

11
Как удалить список строк из кадра данных Pandas?
У меня есть датафрейм df: >>> df sales discount net_sales cogs STK_ID RPT_Date 600141 20060331 2.709 NaN 2.709 2.245 20060630 6.590 NaN 6.590 5.291 20060930 10.103 NaN 10.103 7.981 20061231 15.915 NaN 15.915 12.686 20070331 3.196 NaN 3.196 2.710 20070630 7.907 NaN 7.907 6.459 Затем я хочу удалить строки с …
260 python  pandas 

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.