SQL позволяет вам сохранять и выполнять много разных транзакций отношений и всегда иметь его в доступе для различных целей. По сути один источник правды или место, куда можно пойти. Там наверняка есть над головой. Однако некоторые анализы могут быть очень сложными и требуют значительного количества операций на основе набора, которые могут очень быстро превратить даже небольшой набор данных в большой. У меня были процессы обработки данных, которые имеют более 2000 запросов, которые обрабатывают терабайты менее чем за 5 минут и могут забить миллиарды записей для прогнозирующей модели в конце, а Python и NumPy забрали часть набора данных за 10 раз как хранилище реляционных данных и подавать его до уровня представления.
Дополнительный момент, если вы делаете это в облаке, убедитесь, что у вас есть динамический экземпляр, который может масштабировать его память. С SQL это все о наличии диска и достаточного количества вычислений, чтобы сделать это своевременно.
Я вижу много способов, которыми они могут работать в синергии. Pandas была разработана для многих задач по обработке данных. Некоторые работы по науке данных - это то, для чего были созданы RDB. Используйте оба в балансе.
Это все о правильном инструменте, чтобы сделать правильную работу.