Список списков в массив NumPy


184

Как мне преобразовать простой список списков в массив numpy? Строки являются отдельными подсписками, и каждая строка содержит элементы в подсписке.

Ответы:


199

Если ваш список списков содержит списки с различным количеством элементов, то ответ Игнасио Васкеса-Абрамса не будет работать. Вместо этого есть как минимум 3 варианта:

1) Создайте массив из массивов:

x=[[1,2],[1,2,3],[1]]
y=numpy.array([numpy.array(xi) for xi in x])
type(y)
>>><type 'numpy.ndarray'>
type(y[0])
>>><type 'numpy.ndarray'>

2) Создайте массив списков:

x=[[1,2],[1,2,3],[1]]
y=numpy.array(x)
type(y)
>>><type 'numpy.ndarray'>
type(y[0])
>>><type 'list'>

3) Сначала сделайте списки равными по длине:

x=[[1,2],[1,2,3],[1]]
length = max(map(len, x))
y=numpy.array([xi+[None]*(length-len(xi)) for xi in x])
y
>>>array([[1, 2, None],
>>>       [1, 2, 3],
>>>       [1, None, None]], dtype=object)

15
Спасибо, пришли сюда за это. Некоторое время пользовался numpy и обнаружил, что такое поведение нетривиально. Спасибо, что нашли время, чтобы объяснить этот более общий случай.
Адам Хьюз

dtype=floatтоже работает, конвертируется Noneв np.nan, что может быть полезно.

108
>>> numpy.array([[1, 2], [3, 4]]) 
array([[1, 2], [3, 4]])

13
это автоматически преобразует список списков в двумерный массив, потому что длина всех включенных списков одинакова. Вы знаете, как этого не делать: создать массив списков, даже если все списки имеют одинаковую длину? Или возможно преобразовать 2D-массив в одномерный массив одномерного массива (я имею в виду,
фактически

7
Если это не работает для вас, потому что ваши списки не имеют даже размеров, см. Следующий ответ .
Никана Рекламикс

@NikanaReklawyks Я был смущен после просмотра ответа, но ваш комментарий был полезен. Я обнаружил, что мой список списков был зазубренным, когда это не должно было быть.
Нихил Гиррадж

39

Так как это самый популярный поиск в Google для преобразования списка в массив Numpy, я предложу следующее, несмотря на то, что ему 4 года:

>>> x = [[1, 2], [1, 2, 3], [1]]
>>> y = numpy.hstack(x)
>>> print(y)
[1 2 1 2 3 1]

Когда я впервые подумал сделать это таким образом, я был очень доволен собой, потому что это так просто. Тем не менее, после синхронизации с большим списком списков, это на самом деле быстрее сделать это:

>>> y = numpy.concatenate([numpy.array(i) for i in x])
>>> print(y)
[1 2 1 2 3 1]

Обратите внимание, что ответ @ 1 Бастьяна не составляет единого непрерывного списка, поэтому я добавил concatenate.

Во всяком случае ... Я предпочитаю hstackподход для элегантного использования Numpy.


12
в то время как некоторые люди могут искать это, я уверен, что ОП хотел многомерный nparr.
Натан

1
Я искал это :))
Pallie


6

Опять же, после поиска проблемы преобразования вложенных списков с N уровнями в N-мерный массив я ничего не нашел, поэтому вот мой способ обойти это:

import numpy as np

new_array=np.array([[[coord for coord in xk] for xk in xj] for xj in xi], ndmin=3) #this case for N=3

Обратите внимание, что если у вас уже есть структура вложенных списков, вам не нужна эта [...[...[...]]]часть. Вам просто нужно позвонить np.array, с ndmin=number-of-list-layers. (хотя в моем случае мне нужно было ndmin=number-of-list-layers-minus-1по какой-то причине, иначе создал дополнительный слой - нужно исследовать)
Venryx

Ну, ладно, проблема в моем случае заключается в том, что для самого глубокого «слоя списка» списки не все имеют одинаковую длину, что приводит np.arrayк тому, что они просто «оборачивают» эти самые глубокие списки, а не конвертируют их в массивы.
Venryx

-2

У меня был список списков равной длины. Даже тогда Ignacio Vazquez-Abramsответ не сработал для меня. Я получил двумерный массив NumPy, элементы которого являются списками. Если вы столкнулись с той же проблемой, вы можете использовать метод ниже

использование numpy.vstack

import numpy as np

np_array = np.empty((0,4), dtype='float')
for i in range(10)
     row_data = ...   # get row_data as list
     np_array = np.vstack((np_array, np.array(row_data)))

1
с какой стати вы продолжите складывать, если знаете, что у вас есть 10 списков, почему бы не np.empty ((10, 4)), а затем просто заполнить его?
Мехди

-4

Просто используйте панд

list(pd.DataFrame(listofstuff).melt().values)

это работает только для списка списков

если у вас есть список списков списков, вы можете попробовать что-то вроде

lists(pd.DataFrame(listofstuff).melt().apply(pd.Series).melt().values)
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.