Как мне вставить столбец с определенным индексом столбца в пандах?


189

Могу ли я вставить столбец по определенному индексу столбца в пандах?

import pandas as pd
df = pd.DataFrame({'l':['a','b','c','d'], 'v':[1,2,1,2]})
df['n'] = 0

Это будет столбец nкак последний столбец df, но разве нет способа сказать, dfчтобы поместить nв начале?


Вставьте столбец в начале (крайний левый конец) DataFrame - больше решений + обобщенное решение для вставки любой последовательности (не только постоянного значения).
cs95

Ответы:


370

см. документы: http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.insert.html

использование loc = 0 вставит в начале

df.insert(loc, column, value)

df = pd.DataFrame({'B': [1, 2, 3], 'C': [4, 5, 6]})

df
Out: 
   B  C
0  1  4
1  2  5
2  3  6

idx = 0
new_col = [7, 8, 9]  # can be a list, a Series, an array or a scalar   
df.insert(loc=idx, column='A', value=new_col)

df
Out: 
   A  B  C
0  7  1  4
1  8  2  5
2  9  3  6

18
Для будущих пользователей новыми параметрами являются «loc», «column» и «value» . Источник
Питер Магуайр

11

Вы можете попытаться извлечь столбцы в виде списка, помассировать их так, как хотите, и переиндексировать ваш фрейм данных:

>>> cols = df.columns.tolist()
>>> cols = [cols[-1]]+cols[:-1] # or whatever change you need
>>> df.reindex(columns=cols)

   n  l  v
0  0  a  1
1  0  b  2
2  0  c  1
3  0  d  2

РЕДАКТИРОВАТЬ: это можно сделать в одну строку; однако это выглядит немного некрасиво. Может быть, какое-то более чистое предложение может прийти ...

>>> df.reindex(columns=['n']+df.columns[:-1].tolist())

   n  l  v
0  0  a  1
1  0  b  2
2  0  c  1
3  0  d  2

9

Если вы хотите одно значение для всех строк:

df.insert(0,'name_of_column','')
df['name_of_column'] = value

Редактировать:

Вы также можете:

df.insert(0,'name_of_column',value)

0

Вот очень простой ответ на этот вопрос (только одна строка).

Вы можете сделать это после того, как вы добавили столбец 'n' в ваш df следующим образом.

import pandas as pd
df = pd.DataFrame({'l':['a','b','c','d'], 'v':[1,2,1,2]})
df['n'] = 0

df
    l   v   n
0   a   1   0
1   b   2   0
2   c   1   0
3   d   2   0

# here you can add the below code and it should work.
df = df[list('nlv')]
df

    n   l   v
0   0   a   1
1   0   b   2
2   0   c   1
3   0   d   2



However, if you have words in your columns names instead of letters. It should include two brackets around your column names. 

import pandas as pd
df = pd.DataFrame({'Upper':['a','b','c','d'], 'Lower':[1,2,1,2]})
df['Net'] = 0
df['Mid'] = 2
df['Zsore'] = 2

df

    Upper   Lower   Net Mid Zsore
0   a       1       0   2   2
1   b       2       0   2   2
2   c       1       0   2   2
3   d       2       0   2   2

# here you can add below line and it should work 
df = df[list(('Mid','Upper', 'Lower', 'Net','Zsore'))]
df

   Mid  Upper   Lower   Net Zsore
0   2   a       1       0   2
1   2   b       2       0   2
2   2   c       1       0   2
3   2   d       2       0   2
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.