Вопросы с тегом «pandas»

Pandas - это библиотека Python для манипулирования и анализа данных, например, фреймов данных, многомерных временных рядов и наборов данных поперечного сечения, обычно встречающихся в статистике, результатах экспериментальной науки, эконометрике или финансах. Pandas - одна из основных библиотек данных в Python.

5
Применение функции с несколькими аргументами для создания нового столбца панд
Я хочу создать новый столбец во pandasфрейме данных, применив функцию к двум существующим столбцам. После этого ответа я смог создать новый столбец, когда мне нужен только один столбец в качестве аргумента: import pandas as pd df = pd.DataFrame({"A": [10,20,30], "B": [20, 30, 10]}) def fx(x): return x * x print(df) …
165 python  pandas 

8
Возьмите несколько списков в dataframe
Как взять несколько списков и поместить их в разные столбцы в кадре данных Python? Я попробовал это решение, но у меня возникли проблемы. Попытка 1: Имейте три списка, и соедините их вместе и используйте это res = zip(lst1,lst2,lst3) Дает только один столбец Попытка 2: percentile_list = pd.DataFrame({'lst1Tite' : [lst1], 'lst2Tite' …
165 python  numpy  pandas 

3
Как перебрать сгруппированный фрейм данных Pandas?
DataFrame: c_os_family_ss c_os_major_is l_customer_id_i 0 Windows 7 90418 1 Windows 7 90418 2 Windows 7 90418 Код: print df for name, group in df.groupby('l_customer_id_i').agg(lambda x: ','.join(x)): print name print group Я пытаюсь перебрать агрегированные данные, но получаю сообщение об ошибке: ValueError: слишком много значений для распаковки @EdChum, вот ожидаемый результат: …
165 python  pandas 


13
Сравните два DataFrames и выведите их различия бок о бок
Я пытаюсь выделить именно то, что изменилось между двумя кадрами. Предположим, у меня есть два кадра данных Python Pandas: "StudentRoster Jan-1": id Name score isEnrolled Comment 111 Jack 2.17 True He was late to class 112 Nick 1.11 False Graduated 113 Zoe 4.12 True "StudentRoster Jan-2": id Name score isEnrolled …
163 python  html  pandas  dataframe  panel 

10
Pandas столбец списков, создать строку для каждого элемента списка
У меня есть dataframe, где некоторые ячейки содержат списки нескольких значений. Вместо того, чтобы хранить несколько значений в ячейке, я бы хотел расширить фрейм данных, чтобы каждый элемент в списке получил свою собственную строку (с такими же значениями во всех других столбцах). Так что если у меня есть: import pandas …
163 python  pandas  list 

5
Формат / Подавить научную запись из результатов агрегации Python Pandas
Как можно изменить формат для вывода из групповой операции в пандах, которая выдает научную запись для очень больших чисел? Я знаю, как выполнять форматирование строк в Python, но я не могу понять, как применить его здесь. df1.groupby('dept')['data1'].sum() dept value1 1.192433e+08 value2 1.293066e+08 value3 1.077142e+08 Это подавляет научную нотацию, если я …

12
python pandas: удаляйте дубликаты по столбцам A, сохраняя строку с наибольшим значением в столбце B
У меня есть фрейм данных с повторяющимися значениями в столбце A. Я хочу удалить дубликаты, сохранив строку с самым высоким значением в столбце B. Итак, это: A B 1 10 1 20 2 30 2 40 3 10 Должен превратиться в это: A B 1 20 2 40 3 10 …

7
столбцы pandas GroupBy со значениями NaN (отсутствующими)
У меня есть DataFrame со многими пропущенными значениями в столбцах, которые я хочу сгруппировать: import pandas as pd import numpy as np df = pd.DataFrame({'a': ['1', '2', '3'], 'b': ['4', np.NaN, '6']}) In [4]: df.groupby('b').groups Out[4]: {'4': [0], '6': [2]} видите, что Pandas сбросил строки с целевыми значениями NaN. (Я …

4
Почему слияния панд в python быстрее, чем слияния data.table в R в 2012 году?
Недавно я наткнулся на библиотеку pandas для python, которая в соответствии с этим тестом выполняет очень быстрое слияние в памяти. Это даже быстрее, чем пакет data.table в R (мой язык для анализа). Почему pandasтак быстрее чем data.table? Это из-за присущего скорости питона преимущество над R, или есть какой-то компромисс, о …
160 python  r  join  data.table  pandas 

8
NumPy или Pandas: сохранение типа массива целочисленным при наличии значения NaN
Есть ли предпочтительный способ сохранить тип данных numpyмассива фиксированным как int( int64или что-то еще), в то же время сохраняя элемент внутри как numpy.NaN? В частности, я конвертирую внутреннюю структуру данных в Pandas DataFrame. В нашей структуре у нас есть столбцы целочисленного типа, которые все еще имеют NaN (но d-тип столбца …


6
Удалить все повторяющиеся строки в Python Pandas
pandas drop_duplicatesФункция отлично подходит для «uniquifying» в dataframe. Тем не менее, одним из ключевых аргументов для передачи является take_last=Trueили take_last=False, хотя я хотел бы отбросить все строки, которые являются дубликатами, в подмножестве столбцов. Это возможно? A B C 0 foo 0 A 1 foo 1 A 2 foo 1 B …

6
Случайный выбор строки в кадре данных Pandas
Есть ли способ выбрать случайные строки из DataFrame в Pandas. В R, используя пакет car, есть полезная функция, some(x, n)которая похожа на head, но выбирает, в этом примере, 10 строк случайным образом из x. Я также посмотрел документацию по нарезке, и, похоже, нет ничего эквивалентного. Обновить Сейчас используется версия 20. …
159 python  pandas 

9
Загрузить данные из TXT с пандами
Я загружаю текстовый файл, содержащий смесь данных типа float и string. Я хочу хранить их в массиве, где я могу получить доступ к каждому элементу. Сейчас просто занимаюсь import pandas as pd data = pd.read_csv('output_list.txt', header = None) print data Это структура входного файла: 1 0 2000.0 70.2836942112 1347.28369421 /file_address.txt. …
159 python  io  pandas 

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.