Они оба кажутся чрезвычайно похожими, и мне любопытно, какой пакет будет более полезным для анализа финансовых данных.
Они оба кажутся чрезвычайно похожими, и мне любопытно, какой пакет будет более полезным для анализа финансовых данных.
Ответы:
Pandas предоставляет высокоуровневые инструменты для работы с данными, построенные на основе NumPy. NumPy - довольно низкоуровневый инструмент, похожий на MATLAB. Pandas, с другой стороны, предоставляет богатые функциональные возможности временных рядов, выравнивание данных, удобную для статистики статистику, методы группового объединения, слияния и объединения, а также множество других удобств. Это стало очень популярным в последние годы в финансовых приложениях. В моей следующей книге у меня будет глава, посвященная анализу финансовых данных с использованием панд.
NA-friendly statistics
упомянутым в вашем ответе?
Numpy требуется пандами (и практически всеми числовыми инструментами для Python). Scipy не является обязательным требованием для панд, но указан как «необязательная зависимость». Я бы не сказал, что панды - это альтернатива Нампи и / или Сципи. Скорее, это дополнительный инструмент, который обеспечивает более упорядоченный способ работы с числовыми и табличными данными в Python. Вы можете использовать структуры данных Pandas, но свободно использовать функции Numpy и Scipy для управления ими.
Pandas предлагают отличный способ манипулирования таблицами, поскольку вы можете упростить биннинг ( бин для данных в pandas в Python ) и вычислять статистику. Еще одна вещь, которая хороша в pandas - это класс Panel, в котором вы можете объединять серии слоев с разными свойствами и комбинировать их с помощью функции groupby.