Financial Services - большой пользователь Big Data и новатор. Одним из примеров является торговля ипотечными облигациями. Чтобы ответить на ваши вопросы для этого:
Какие данные эти компании использовали. Каков был размер данных?
- Длинные истории каждой ипотеки выдаются за последние много лет, а выплаты по месяцам против них. (Миллиарды строк)
- Длинные истории кредитных историй. (Миллиарды строк)
- Индексы цен на жилье. (Не такой большой)
Какие инструменты технологий они использовали для обработки данных?
Различается. Некоторые используют собственные решения, основанные на базах данных, таких как Netezza или Teradata. Другие получают доступ к данным через системы, предоставляемые поставщиками данных. (Corelogic, Experian и т. Д.) Некоторые банки используют технологии колоночных баз данных, такие как KDB или 1010data.
В чем заключалась проблема, с которой они столкнулись, и как понимание, которое они получили, помогло им решить проблему.
Ключевой вопрос заключается в определении того, когда ипотечные облигации (ипотечные ценные бумаги) будут досрочно погашаться или не будут выполняться Это особенно важно для облигаций, в которых отсутствует государственная гарантия. Копаясь в истории платежей, кредитных файлах и понимая текущую стоимость дома, можно предсказать вероятность дефолта. Добавление модели процентной ставки и модели предоплаты также помогает прогнозировать вероятность предоплаты.
Как они выбрали инструмент \ технологию, чтобы удовлетворить их потребности.
Если проект управляется внутренними ИТ-отделами, обычно он базируется на крупных поставщиках баз данных, таких как Oracle, Teradata или Netezza. Если это обусловлено квантами, то они с большей вероятностью напрямую обращаются к поставщику данных или к сторонней системе «Все в».
Какую модель они определили по данным и какие шаблоны они искали по данным.
100 , 000 , 000 б е I п гш о т т ч т ч т т о ц н т , О г ы л я т т л е ы