Вопросы с тегом «pandas»

Pandas - это библиотека Python для манипулирования и анализа данных, например, фреймов данных, многомерных временных рядов и наборов данных поперечного сечения, обычно встречающихся в статистике, результатах экспериментальной науки, эконометрике или финансах. Pandas - одна из основных библиотек данных в Python.

11
Как записать в существующий файл Excel без перезаписи данных (с помощью pandas)?
Я использую pandas для записи в файл excel следующим образом: import pandas writer = pandas.ExcelWriter('Masterfile.xlsx') data_filtered.to_excel(writer, "Main", cols=['Diff1', 'Diff2']) writer.save() Masterfile.xlsx уже состоит из нескольких разных вкладок. Однако в нем еще нет «Main». Pandas правильно пишет на "Основном" листе, но, к сожалению, удаляет и все остальные вкладки.

11
Найдите максимальное значение столбца и верните соответствующие значения строки с помощью Pandas
Используя Python Pandas, я пытаюсь найти Country& Placeс максимальным значением. Это возвращает максимальное значение: data.groupby(['Country','Place'])['Value'].max() Но как мне получить соответствующее Countryи Placeимя?
121 python  pandas  dataframe  max 

14
Как разложить (взорвать) столбец в фрейме данных pandas?
У меня есть следующий DataFrame, в котором один из столбцов является объектом (ячейка типа списка): df=pd.DataFrame({'A':[1,2],'B':[[1,2],[1,2]]}) df Out[458]: A B 0 1 [1, 2] 1 2 [1, 2] Мой ожидаемый результат: A B 0 1 1 1 1 2 3 2 1 4 2 2 Что мне делать для этого? …
120 python  pandas  dataframe 

4
панды конвертируют некоторые столбцы в строки
Итак, в моем наборе данных есть информация по местоположению для n дат. Проблема в том, что каждая дата на самом деле является отдельным заголовком столбца. Например, CSV выглядит как location name Jan-2010 Feb-2010 March-2010 A "test" 12 20 30 B "foo" 18 20 25 Я бы хотел, чтобы это выглядело …
120 python  pandas 

1
Какие правила использует Pandas для создания представления или копии?
Я смущен правилами, которые использует Pandas, когда решает, что выбор из фрейма данных является копией исходного фрейма данных или представлением оригинала. Если у меня, например, df = pd.DataFrame(np.random.randn(8,8), columns=list('ABCDEFGH'), index=range(1,9)) Я понимаю, что a queryвозвращает копию, поэтому что-то вроде foo = df.query('2 < index <= 5') foo.loc[:,'E'] = 40 не …

8
Вектор-столбец y был передан, когда ожидался 1d-массив
Мне нужно соответствовать RandomForestRegressorот sklearn.ensemble. forest = ensemble.RandomForestRegressor(**RF_tuned_parameters) model = forest.fit(train_fold, train_y) yhat = model.predict(test_fold) Этот код всегда работал, пока я не произвел предварительную обработку данных ( train_y). В сообщении об ошибке говорится: DataConversionWarning: вектор-столбец y был передан, когда ожидался массив 1d. Измените форму y на (n_samples,), например, используя ravel …

3
Как проверить, содержит ли строка одну из подстрок в списке в пандах?
Есть ли какая-нибудь функция, которая была бы эквивалентом комбинации df.isin()и df[col].str.contains()? Например, скажем, у меня есть серия s = pd.Series(['cat','hat','dog','fog','pet']), и я хочу найти все места, где sесть что-то из ['og', 'at'], я бы хотел получить все, кроме «pet». У меня есть решение, но довольно неэлегантное: searchfor = ['og', 'at'] …

5
добавить префикс строки к каждому значению в столбце строки с помощью Pandas
Я хотел бы добавить строку в начало каждого значения в указанном столбце фрейма данных pandas (элегантно). Я уже понял, как это сделать, и сейчас использую: df.ix[(df['col'] != False), 'col'] = 'str'+df[(df['col'] != False), 'col'] Это кажется чертовски неэлегантным делом - знаете ли вы какой-либо другой способ (который, возможно, также добавляет …

3
Как подавить предупреждение Pandas Future?
Когда я запускаю программу, Pandas каждый раз выдает предупреждение о будущем, как показано ниже. D:\Python\lib\site-packages\pandas\core\frame.py:3581: FutureWarning: rename with inplace=True will return None from pandas 0.11 onward " from pandas 0.11 onward", FutureWarning) Я получил сообщение, но я просто хочу, чтобы Pandas снова и снова не показывал такое сообщение, есть ли …

6
Игнорирование NaN с помощью str.contains
Я хочу найти строки, содержащие строку, например: DF[DF.col.str.contains("foo")] Однако это не удается, потому что некоторые элементы имеют NaN: ValueError: невозможно проиндексировать вектор, содержащий значения NA / NaN Поэтому я прибегаю к запутанному DF[DF.col.notnull()][DF.col.dropna().str.contains("foo")] Есть ли способ лучше?
118 python  pandas 

17
Как преобразовать результат SQL-запроса в структуру данных PANDAS?
Мы будем благодарны за любую помощь по этой проблеме. Итак, в основном я хочу запустить запрос к моей базе данных SQL и сохранить возвращенные данные в виде структуры данных Pandas. Я прикрепил код для запроса. Я читаю документацию по Pandas, но не могу определить тип возвращаемого значения моего запроса. Я …

4
Правильный способ отменить pandas.DataFrame?
Вот мой код: import pandas as pd data = pd.DataFrame({'Odd':[1,3,5,6,7,9], 'Even':[0,2,4,6,8,10]}) for i in reversed(data): print(data['Odd'], data['Even']) Когда я запускаю этот код, я получаю следующую ошибку: Traceback (most recent call last): File "C:\Python33\lib\site-packages\pandas\core\generic.py", line 665, in _get_item_cache return cache[item] KeyError: 5 During handling of the above exception, another exception occurred: …
117 python  pandas  reverse 

9
Распечатать очень длинную строку полностью в кадре данных pandas
Я борюсь с, казалось бы, очень простой вещью: у меня есть фрейм данных pandas, содержащий очень длинную строку. df = pd.DataFrame({'one' : ['one', 'two', 'This is very long string very long string very long string veryvery long string']}) Теперь, когда я пытаюсь напечатать то же самое, я не вижу полной …
116 python  string  pandas  options 

9
Pandas DataFrame в список списков
Список списков легко превратить в фреймворк pandas: import pandas as pd df = pd.DataFrame([[1,2,3],[3,4,5]]) Но как мне снова превратить df в список списков? lol = df.what_to_do_now? print lol # [[1,2,3],[3,4,5]]
116 python  pandas 

8
Создание фрейма данных из словаря, где записи имеют разную длину
Скажем, у меня есть словарь с 10 парами ключ-значение. Каждая запись содержит массив numpy. Однако длина массива не у всех одинакова. Как я могу создать фрейм данных, в котором каждый столбец содержит отдельную запись? Когда я пытаюсь: pd.DataFrame(my_dict) Я получил: ValueError: arrays must all be the same length Любой способ …
115 python  pandas 

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.