Вопросы с тегом «pandas»

Pandas - это библиотека Python для манипулирования и анализа данных, например, фреймов данных, многомерных временных рядов и наборов данных поперечного сечения, обычно встречающихся в статистике, результатах экспериментальной науки, эконометрике или финансах. Pandas - одна из основных библиотек данных в Python.

3
Вычислить разницу во времени Pandas DataFrame между двумя столбцами в часах и минутах
У меня есть два столбца fromdateи todateв кадре данных. import pandas as pd data = {'todate': [pd.Timestamp('2014-01-24 13:03:12.050000'), pd.Timestamp('2014-01-27 11:57:18.240000'), pd.Timestamp('2014-01-23 10:07:47.660000')], 'fromdate': [pd.Timestamp('2014-01-26 23:41:21.870000'), pd.Timestamp('2014-01-27 15:38:22.540000'), pd.Timestamp('2014-01-23 18:50:41.420000')]} df = pd.DataFrame(data) Я добавляю новый столбец, diffчтобы найти разницу между двумя датами, используя df['diff'] = df['fromdate'] - df['todate'] Я получаю …

5
Добавить массив numpy в качестве столбца во фрейм данных Pandas
У меня есть объект фрейма данных Pandas формы (X, Y), который выглядит так: [[1, 2, 3], [4, 5, 6], [7, 8, 9]] и многочисленная разреженная матрица (CSC) формы (X, Z), которая выглядит примерно так [[0, 1, 0], [0, 0, 1], [1, 0, 0]] Как я могу добавить содержимое из матрицы …
85 python  numpy  pandas 

2
сохранить график гистограммы pandas.Series в файл
В ipython Notebook сначала создайте объект серии pandas, затем, вызвав метод экземпляра .hist (), браузер отобразит рисунок. Мне интересно, как сохранить этот рисунок в файл (я имею в виду не щелчок правой кнопкой мыши и сохранение как, а команды, необходимые в сценарии).


6
Индекс доступа последнего элемента в фрейме данных
Я искал это, но, похоже, не нашел (хотя это должно быть чрезвычайно тривиально). Проблема в том, что я хотел бы получить значение столбца для первой и последней записи фрейма данных. Но если я это сделаю: df.ix[0]['date'] Я получил: datetime.datetime(2011, 1, 10, 16, 0) но если я это сделаю: df[-1:]['date'] Я …
84 python  pandas 


2
Как мне создать новый столбец из вывода pandas groupby (). Sum ()?
Попытка создать новый столбец из groupbyрасчета. В приведенном ниже коде я получаю правильные рассчитанные значения для каждой даты (см. Группу ниже), но когда я пытаюсь создать с ним новый столбец ( df['Data4']), я получаю NaN. Итак, я пытаюсь создать новый столбец в фрейме данных с суммой Data3для всех дат и …

7
Найдите уникальные значения в столбце и отсортируйте их
У меня есть фреймворк pandas. Я хочу напечатать уникальные значения одного из его столбцов в порядке возрастания. Вот как я это делаю: import pandas as pd df = pd.DataFrame({'A':[1,1,3,2,6,2,8]}) a = df['A'].unique() print a.sort() Проблема в том, что я получаю Noneна выходе.

5
Несколько выходов ячеек IPython Notebook
Я запускаю эту ячейку в IPython Notebook: # salaries and teams are Pandas dataframe salaries.head() teams.head() В результате я получаю вывод только teamsкадра данных, а не обоих salariesи teams. Если я просто запускаю, salaries.head()я получаю результат для salariesкадра данных, но при запуске обоих операторов я просто вижу результат teams.head(). Как …

6
Как объединить серию и DataFrame
Если вы пришли сюда в поисках информации о том, как объединить a DataFrameи Seriesиндекс , пожалуйста, посмотрите этот ответ . Первоначальное намерение OP состояло в том, чтобы спросить, как назначить элементы серии в качестве столбцов другому DataFrame . Если вам интересно узнать ответ на этот вопрос, посмотрите на принятый ответ …

5
Как сгруппировать записи DataFrame pandas по дате в неуникальном столбце
Pandas DataFrameсодержит столбец с именем, "date"который содержит неуникальные datetimeзначения. Я могу сгруппировать строки в этом кадре, используя: data.groupby(data['date']) Однако при этом данные разбиваются по datetimeзначениям. Я хотел бы сгруппировать эти данные по годам, хранящимся в столбце «Дата». На этой странице показано, как группировать по годам в случаях, когда отметка времени …
82 python  pandas 

3
Удалить NaN из серии pandas
Есть ли способ удалить значения NaN из серии панда? У меня есть серия, в которой могут быть или не быть некоторые значения NaN, и я хотел бы вернуть копию серии со всеми удаленными NaN.
81 python  pandas  series 

1
В какой ситуации я могу использовать Dask вместо Apache Spark? [закрыто]
Закрыто . Этот вопрос основан на мнении . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы на него можно было ответить с помощью фактов и цитат, отредактировав этот пост . Закрыт 4 года назад . Уточните этот вопрос В настоящее время я использую Pandas …

3
Производительность Pandas применяется против np.vectorize для создания нового столбца из существующих столбцов
Я использую фреймы данных Pandas и хочу создать новый столбец как функцию существующих столбцов. Я не видел хорошего обсуждения разницы в скорости между df.apply()и np.vectorize(), поэтому подумал, что спрошу здесь. Функция Pandas apply()медленная. Из того, что я измерил (показано ниже в некоторых экспериментах), использование np.vectorize()в 25 раз (или больше) быстрее, …

4
Сюжет панд не отображается
При использовании этого в скрипте (не в IPython) ничего не происходит, т.е. окно графика не появляется: import numpy as np import pandas as pd ts = pd.Series(np.random.randn(1000), index=pd.date_range('1/1/2000', periods=1000)) ts.plot() Даже при добавлении time.sleep(5)все равно ничего нет. Почему? Есть ли способ сделать это без ручного вызова matplotlib ?

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.