Переопределение индекса в объекте Pandas DataFrame


84

Я пытаюсь переиндексировать DataFrameобъект pandas , например,

From:
            a   b   c
        0   1   2   3
        1  10  11  12
        2  20  21  22

To :
           b   c
       1   2   3
      10  11  12
      20  21  22

Я делаю это, как показано ниже, и получаю неправильный ответ. Есть подсказки, как это сделать?

>>> col = ['a','b','c']
>>> data = DataFrame([[1,2,3],[10,11,12],[20,21,22]],columns=col)
>>> data
    a   b   c
0   1   2   3
1  10  11  12
2  20  21  22
>>> idx2 = data.a.values
>>> idx2
array([ 1, 10, 20], dtype=int64)
>>> data2 = DataFrame(data,index=idx2,columns=col[1:])
>>> data2
     b   c
1   11  12
10 NaN NaN
20 NaN NaN

Есть идеи, почему это происходит?


1
поскольку вы используете 1-й DF для создания второго, будут получены только строки, в которых idx2 пересекает data.index, т.е. строка 1
RuiDC

Ответы:


188

Почему бы вам просто не использовать set_indexметод?

In : col = ['a','b','c']

In : data = DataFrame([[1,2,3],[10,11,12],[20,21,22]],columns=col)

In : data
Out:
    a   b   c
0   1   2   3
1  10  11  12
2  20  21  22

In : data2 = data.set_index('a')

In : data2
Out:
     b   c
a
1    2   3
10  11  12
20  21  22

17
Чтобы удалить имя индекса, как в исходном примере: data2.index.name = None
Даниэле

5

Если вам не нужна буква "а" в индексе

В :

col = ['a','b','c']

data = DataFrame([[1,2,3],[10,11,12],[20,21,22]],columns=col)

data

Из:

    a   b   c
0   1   2   3
1  10  11  12
2  20  21  22

В :

data2 = data.set_index('a')

Из:

     b   c
a
1    2   3
10  11  12
20  21  22

В :

data2.index.name = None

Из:

     b   c
 1   2   3
10  11  12
20  21  22

1
Второй Аут не правильный. Слева все еще есть безымянный столбец, содержащий 0, 1, 2.
Yster
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.