Я ожидал, что ваш синтаксис тоже будет работать. Проблема возникает из-за того, что при создании новых столбцов с синтаксисом списка столбцов ( df[[new1, new2]] = ...
) pandas требует, чтобы правая сторона была DataFrame (обратите внимание, что на самом деле не имеет значения, имеют ли столбцы DataFrame те же имена, что и столбцы вы создаете).
Ваш синтаксис отлично подходит для присвоения скалярных значений существующим столбцам, и pandas также с радостью назначает скалярные значения новому столбцу, используя синтаксис одного столбца ( df[new1] = ...
). Таким образом, решение состоит в том, чтобы либо преобразовать это в несколько назначений с одним столбцом, либо создать подходящий DataFrame для правой стороны.
Вот несколько подходов, которые будут работать:
import pandas as pd
import numpy as np
df = pd.DataFrame({
'col_1': [0, 1, 2, 3],
'col_2': [4, 5, 6, 7]
})
Тогда одно из следующего:
1) Три присваивания в одном, используя распаковку списка:
df['column_new_1'], df['column_new_2'], df['column_new_3'] = [np.nan, 'dogs', 3]
2) DataFrame
удобно расширяет одну строку в соответствии с индексом, поэтому вы можете сделать это:
df[['column_new_1', 'column_new_2', 'column_new_3']] = pd.DataFrame([[np.nan, 'dogs', 3]], index=df.index)
3) Создайте временный фрейм данных с новыми столбцами, а затем объедините его с исходным фреймом данных позже:
df = pd.concat(
[
df,
pd.DataFrame(
[[np.nan, 'dogs', 3]],
index=df.index,
columns=['column_new_1', 'column_new_2', 'column_new_3']
)
], axis=1
)
4) Аналогично предыдущему, но с использованием join
вместо concat
(может быть менее эффективным):
df = df.join(pd.DataFrame(
[[np.nan, 'dogs', 3]],
index=df.index,
columns=['column_new_1', 'column_new_2', 'column_new_3']
))
5) Использование dict - более «естественный» способ создания нового фрейма данных, чем два предыдущих, но новые столбцы будут отсортированы в алфавитном порядке (по крайней мере, до Python 3.6 или 3.7 ):
df = df.join(pd.DataFrame(
{
'column_new_1': np.nan,
'column_new_2': 'dogs',
'column_new_3': 3
}, index=df.index
))
6) Используйте .assign()
с несколькими аргументами столбца.
Мне очень нравится этот вариант ответа @ zero, но, как и предыдущий, новые столбцы всегда будут отсортированы в алфавитном порядке, по крайней мере, в ранних версиях Python:
df = df.assign(column_new_1=np.nan, column_new_2='dogs', column_new_3=3)
new_cols = ['column_new_1', 'column_new_2', 'column_new_3']
new_vals = [np.nan, 'dogs', 3]
df = df.reindex(columns=df.columns.tolist() + new_cols) # add empty cols
df[new_cols] = new_vals # multi-column assignment works for existing cols
8) В конце концов, сложно пройти три отдельных задания:
df['column_new_1'] = np.nan
df['column_new_2'] = 'dogs'
df['column_new_3'] = 3
Примечание: многие из этих параметров уже были рассмотрены в других ответах: добавить несколько столбцов в DataFrame и установить их равными существующему столбцу , можно ли добавить сразу несколько столбцов в DataFrame pandas? , Добавить несколько пустых столбцов в pandas DataFrame
KeyError: "None of [Index(['column_new_1', 'column_new_2', 'column_new_3'], dtype='object')] are in the [columns]"