Сохранение списка DataFrames в многолистовой электронной таблице Excel


89

Как я могу экспортировать список DataFrames в одну электронную таблицу Excel?
Документы для to_excelсостояния:

Примечания.
При передаче существующего объекта ExcelWriter лист будет добавлен в существующую книгу. Это можно использовать для сохранения разных DataFrames в одну книгу.

writer = ExcelWriter('output.xlsx')
df1.to_excel(writer, 'sheet1')
df2.to_excel(writer, 'sheet2')
writer.save()

После этого я подумал, что могу написать функцию, которая сохраняет список DataFrames в одну электронную таблицу следующим образом:

from openpyxl.writer.excel import ExcelWriter
def save_xls(list_dfs, xls_path):
    writer = ExcelWriter(xls_path)
    for n, df in enumerate(list_dfs):
        df.to_excel(writer,'sheet%s' % n)
    writer.save()

Однако (со списком из двух небольших DataFrames, каждый из которых можно сохранять to_excelиндивидуально) возникает исключение (Edit: трассировка удалена) :

AttributeError: 'str' object has no attribute 'worksheets'

Предположительно я не ExcelWriterправильно звоню , как мне быть, чтобы это сделать?

Ответы:


135

Вы должны использовать собственный ExcelWriterкласс pandas :

from pandas import ExcelWriter
# from pandas.io.parsers import ExcelWriter

Тогда save_xlsфункция работает как положено:

def save_xls(list_dfs, xls_path):
    with ExcelWriter(xls_path) as writer:
        for n, df in enumerate(list_dfs):
            df.to_excel(writer,'sheet%s' % n)
        writer.save()

11
Как вы оцениваете скорость этого? Вчера я попытался сделать то же самое и обнаружил, что запись фрейма данных с 2000 столбцами в файл .xlsx занимает около 16 секунд на 100 строк на приличной рабочей станции с твердотельным накопителем. Некоторое быстрое профилирование с помощью% prun в ipython показало, что это связано с обработкой XML. В конце концов, я получил данные в Excel, перейдя через CSV, потому что скорость ExcelWriter была слишком низкой.
snth 09

6
Все еще так же медленно в 2018 году.
stmax

2
Вы также можете использовать его ExcelWriterкак менеджер контекста. with ExcelWriter(xls_path) as writer: df.to_excel(writer, sheet_name)
BallpointBen

2
Спасибо, Энди. Не могли бы вы объяснить 'sheet%s' % nнемного, пожалуйста? Что он делает и как работает?
Боуэн Лю

2
@BowenLiu Это просто присвоение имен листам Sheet1, Sheet2 и т. Д.
xiaomy

17

Если кому-то нужен пример того, как это сделать со словарем фреймов данных:

from pandas import ExcelWriter

def save_xls(dict_df, path):
"""
Save a dictionary of dataframes to an excel file, with each dataframe as a seperate page
"""

    writer = ExcelWriter(path)
    for key in dict_df:
        dict_df[key].to_excel(writer, key)

    writer.save()

пример: save_xls(dict_df = my_dict, path = '~/my_path.xls')


Это действительно спасло мне день. Но есть одна вещь, которую я не понимаю, хотя это сработало. Что делает эта часть '%s' % key? Не могли бы вы объяснить это? Благодарность!
Боуэн Лю

@BowenLiu, который принимает значение ключа словаря и использует его для имени страницы на листе Excel. '% s' - это заполнитель, который заполняется "ключом". Надеюсь, это поможет.
Джаред Маркс,
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.