программирование pandas

11

Как записать в существующий файл Excel без перезаписи данных (с помощью pandas)?

Я использую pandas для записи в файл excel следующим образом: import pandas writer = pandas.ExcelWriter('Masterfile.xlsx') data_filtered.to_excel(writer, "Main", cols=['Diff1', 'Diff2']) writer.save() Masterfile.xlsx уже состоит из нескольких разных вкладок. Однако в нем еще нет «Main». Pandas правильно пишет на "Основном" листе, но, к сожалению, удаляет и все остальные вкладки.

121 python excel python-2.7 pandas

11

Найдите максимальное значение столбца и верните соответствующие значения строки с помощью Pandas

Используя Python Pandas, я пытаюсь найти Country& Placeс максимальным значением. Это возвращает максимальное значение: data.groupby(['Country','Place'])['Value'].max() Но как мне получить соответствующее Countryи Placeимя?

121 python pandas dataframe max

14

Как разложить (взорвать) столбец в фрейме данных pandas?

У меня есть следующий DataFrame, в котором один из столбцов является объектом (ячейка типа списка): df=pd.DataFrame({'A':[1,2],'B':[[1,2],[1,2]]}) df Out[458]: A B 0 1 [1, 2] 1 2 [1, 2] Мой ожидаемый результат: A B 0 1 1 1 1 2 3 2 1 4 2 2 Что мне делать для этого? …

120 python pandas dataframe

4

панды конвертируют некоторые столбцы в строки

Итак, в моем наборе данных есть информация по местоположению для n дат. Проблема в том, что каждая дата на самом деле является отдельным заголовком столбца. Например, CSV выглядит как location name Jan-2010 Feb-2010 March-2010 A "test" 12 20 30 B "foo" 18 20 25 Я бы хотел, чтобы это выглядело …

120 python pandas

1

Какие правила использует Pandas для создания представления или копии?

Я смущен правилами, которые использует Pandas, когда решает, что выбор из фрейма данных является копией исходного фрейма данных или представлением оригинала. Если у меня, например, df = pd.DataFrame(np.random.randn(8,8), columns=list('ABCDEFGH'), index=range(1,9)) Я понимаю, что a queryвозвращает копию, поэтому что-то вроде foo = df.query('2 < index <= 5') foo.loc[:,'E'] = 40 не …

119 python pandas dataframe indexing chained-assignment

8

Вектор-столбец y был передан, когда ожидался 1d-массив

Мне нужно соответствовать RandomForestRegressorот sklearn.ensemble. forest = ensemble.RandomForestRegressor(**RF_tuned_parameters) model = forest.fit(train_fold, train_y) yhat = model.predict(test_fold) Этот код всегда работал, пока я не произвел предварительную обработку данных ( train_y). В сообщении об ошибке говорится: DataConversionWarning: вектор-столбец y был передан, когда ожидался массив 1d. Измените форму y на (n_samples,), например, используя ravel …

119 python pandas numpy scikit-learn

3

Как проверить, содержит ли строка одну из подстрок в списке в пандах?

Есть ли какая-нибудь функция, которая была бы эквивалентом комбинации df.isin()и df[col].str.contains()? Например, скажем, у меня есть серия s = pd.Series(['cat','hat','dog','fog','pet']), и я хочу найти все места, где sесть что-то из ['og', 'at'], я бы хотел получить все, кроме «pet». У меня есть решение, но довольно неэлегантное: searchfor = ['og', 'at'] …

119 python string pandas dataframe match

5

добавить префикс строки к каждому значению в столбце строки с помощью Pandas

Я хотел бы добавить строку в начало каждого значения в указанном столбце фрейма данных pandas (элегантно). Я уже понял, как это сделать, и сейчас использую: df.ix[(df['col'] != False), 'col'] = 'str'+df[(df['col'] != False), 'col'] Это кажется чертовски неэлегантным делом - знаете ли вы какой-либо другой способ (который, возможно, также добавляет …

119 python string pandas dataframe

3

Как подавить предупреждение Pandas Future?

Когда я запускаю программу, Pandas каждый раз выдает предупреждение о будущем, как показано ниже. D:\Python\lib\site-packages\pandas\core\frame.py:3581: FutureWarning: rename with inplace=True will return None from pandas 0.11 onward " from pandas 0.11 onward", FutureWarning) Я получил сообщение, но я просто хочу, чтобы Pandas снова и снова не показывал такое сообщение, есть ли …

118 python pandas suppress-warnings future-warning

6

Игнорирование NaN с помощью str.contains

Я хочу найти строки, содержащие строку, например: DF[DF.col.str.contains("foo")] Однако это не удается, потому что некоторые элементы имеют NaN: ValueError: невозможно проиндексировать вектор, содержащий значения NA / NaN Поэтому я прибегаю к запутанному DF[DF.col.notnull()][DF.col.dropna().str.contains("foo")] Есть ли способ лучше?

118 python pandas

17

Как преобразовать результат SQL-запроса в структуру данных PANDAS?

Мы будем благодарны за любую помощь по этой проблеме. Итак, в основном я хочу запустить запрос к моей базе данных SQL и сохранить возвращенные данные в виде структуры данных Pandas. Я прикрепил код для запроса. Я читаю документацию по Pandas, но не могу определить тип возвращаемого значения моего запроса. Я …

118 python mysql data-structures pandas

4

Правильный способ отменить pandas.DataFrame?

Вот мой код: import pandas as pd data = pd.DataFrame({'Odd':[1,3,5,6,7,9], 'Even':[0,2,4,6,8,10]}) for i in reversed(data): print(data['Odd'], data['Even']) Когда я запускаю этот код, я получаю следующую ошибку: Traceback (most recent call last): File "C:\Python33\lib\site-packages\pandas\core\generic.py", line 665, in _get_item_cache return cache[item] KeyError: 5 During handling of the above exception, another exception occurred: …

117 python pandas reverse

9

Распечатать очень длинную строку полностью в кадре данных pandas

Я борюсь с, казалось бы, очень простой вещью: у меня есть фрейм данных pandas, содержащий очень длинную строку. df = pd.DataFrame({'one' : ['one', 'two', 'This is very long string very long string very long string veryvery long string']}) Теперь, когда я пытаюсь напечатать то же самое, я не вижу полной …

116 python string pandas options

9

Pandas DataFrame в список списков

Список списков легко превратить в фреймворк pandas: import pandas as pd df = pd.DataFrame([[1,2,3],[3,4,5]]) Но как мне снова превратить df в список списков? lol = df.what_to_do_now? print lol # [[1,2,3],[3,4,5]]

116 python pandas

8

Создание фрейма данных из словаря, где записи имеют разную длину

Скажем, у меня есть словарь с 10 парами ключ-значение. Каждая запись содержит массив numpy. Однако длина массива не у всех одинакова. Как я могу создать фрейм данных, в котором каждый столбец содержит отдельную запись? Когда я пытаюсь: pd.DataFrame(my_dict) Я получил: ValueError: arrays must all be the same length Любой способ …

115 python pandas

Вопросы с тегом «pandas»