Вопросы с тегом «pandas»

Pandas - это библиотека Python для манипулирования и анализа данных, например, фреймов данных, многомерных временных рядов и наборов данных поперечного сечения, обычно встречающихся в статистике, результатах экспериментальной науки, эконометрике или финансах. Pandas - одна из основных библиотек данных в Python.

5
Добавить недостающие даты в фреймворк pandas
Мои данные могут иметь несколько событий на заданную дату или НИКАКИХ событий на дату. Я беру эти события, подсчитываю по дате и рисую их. Однако, когда я их рисую, две мои серии не всегда совпадают. idx = pd.date_range(df['simpleDate'].min(), df['simpleDate'].max()) s = df.groupby(['simpleDate']).size() В приведенном выше коде idx становится диапазоном, скажем, …
128 python  date  plot  pandas  dataframe 

7
Замена Pandas или Numpy Nan на None для использования с MysqlDB
Я пытаюсь записать фреймворк Pandas (или можно использовать массив numpy) в базу данных mysql с помощью MysqlDB. MysqlDB, похоже, не понимает "nan", и моя база данных выдает ошибку, говоря, что nan отсутствует в списке полей. Мне нужно найти способ преобразовать «nan» в NoneType. Любые идеи?

8
Используйте .corr, чтобы получить корреляцию между двумя столбцами
У меня есть следующий фреймворк pandas Top15: Я создаю столбец, в котором оценивается количество цитируемых документов на человека: Top15['PopEst'] = Top15['Energy Supply'] / Top15['Energy Supply per Capita'] Top15['Citable docs per Capita'] = Top15['Citable documents'] / Top15['PopEst'] Я хочу знать соотношение между количеством цитируемых документов на душу населения и энергоснабжением на …

4
datetime dtypes в пандах read_csv
Я читаю файл csv с несколькими столбцами datetime. Мне нужно установить типы данных при чтении в файле, но проблема с датами. Например: headers = ['col1', 'col2', 'col3', 'col4'] dtypes = ['datetime', 'datetime', 'str', 'float'] pd.read_csv(file, sep='\t', header=None, names=headers, dtype=dtypes) При запуске выдает ошибку: TypeError: тип данных "datetime" не распознан Преобразование …

4
Как сформировать столбец кортежа из двух столбцов в Pandas
У меня есть DataFrame Pandas, и я хочу объединить столбцы lat и long, чтобы сформировать кортеж. <class 'pandas.core.frame.DataFrame'> Int64Index: 205482 entries, 0 to 209018 Data columns: Month 205482 non-null values Reported by 205482 non-null values Falls within 205482 non-null values Easting 205482 non-null values Northing 205482 non-null values Location 205482 …

6
Как сохранить индекс при использовании pandas merge
Я хотел бы объединить два DataFramesи сохранить индекс из первого кадра в качестве индекса в объединенном наборе данных. Однако, когда я выполняю слияние, полученный DataFrame имеет целочисленный индекс. Как я могу указать, что хочу сохранить индекс из левого фрейма данных? In [4]: a = pd.DataFrame({'col1': {'a': 1, 'b': 2, 'c': …
126 python  pandas 

7
Как оценить, сколько памяти потребуется для DataFrame Pandas?
Мне было интересно ... Если я читаю, скажем, файл csv размером 400 МБ в фрейм данных pandas (с использованием read_csv или read_table), есть ли способ предположить, сколько памяти для этого потребуется? Просто пытаюсь лучше понять фреймы данных и память ...
126 python  pandas 

9
Python pandas удаляет повторяющиеся столбцы
Каков самый простой способ удалить повторяющиеся столбцы из фрейма данных? Я читаю текстовый файл с повторяющимися столбцами через: import pandas as pd df=pd.read_table(fname) Имена столбцов: Time, Time Relative, N2, Time, Time Relative, H2, etc... Все столбцы Time и Time Relative содержат одни и те же данные. Я хочу: Time, Time …
126 python  pandas 

2
Как создать DataFrame из случайных целых чисел с помощью Pandas?
Я знаю, что если я использую randn, import pandas as pd import numpy as np df = pd.DataFrame(np.random.randn(100, 4), columns=list('ABCD')) дает мне то, что я ищу, но с элементами нормального распределения. Но что, если мне просто нужны случайные целые числа? randintработает, предоставляя диапазон, но не массив, как это randnделает. Итак, …

6
Условная замена панд
У меня есть DataFrame, и я хочу заменить значения в определенном столбце, которые превышают значение на ноль. Я думал, что это способ добиться этого: df[df.my_channel > 20000].my_channel = 0 Если я скопирую канал в новый фрейм данных, это просто: df2 = df.my_channel df2[df2 > 20000] = 0 Это делает именно …

3
Найдите имя столбца, которое имеет максимальное значение для каждой строки
У меня есть такой DataFrame: In [7]: frame.head() Out[7]: Communications and Search Business General Lifestyle 0 0.745763 0.050847 0.118644 0.084746 0 0.333333 0.000000 0.583333 0.083333 0 0.617021 0.042553 0.297872 0.042553 0 0.435897 0.000000 0.410256 0.153846 0 0.358974 0.076923 0.410256 0.153846 Здесь я хочу спросить, как получить имя столбца, которое имеет …
123 python  pandas  dataframe  max 


8
Как добавить несколько столбцов в фрейм данных pandas за одно задание?
Я новичок в пандах и пытаюсь понять, как одновременно добавить несколько столбцов в панды. Любая помощь здесь приветствуется. В идеале я хотел бы сделать это за один шаг, а не за несколько повторяющихся шагов ... import pandas as pd df = {'col_1': [0, 1, 2, 3], 'col_2': [4, 5, 6, …
122 python  pandas  dataframe 

3
получение индекса строки в функции применения панд
Я пытаюсь получить доступ к индексу строки в функции, применяемой ко всему DataFrameв Pandas. У меня примерно так: df = pandas.DataFrame([[1,2,3],[4,5,6]], columns=['a','b','c']) >>> df a b c 0 1 2 3 1 4 5 6 и я определю функцию, которая обращается к элементам с заданной строкой def rowFunc(row): return row['a'] …
121 python  pandas  dataframe 


Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.