Я пытаюсь понять, как все компоненты «больших данных» играют вместе в реальном случае, например, hadoop, monogodb / nosql, storm, kafka, ... Я знаю, что это довольно широкий спектр инструментов, используемых для разные типы, но я хотел бы узнать больше об их взаимодействии в приложениях, например, мышление, машинное обучение для приложения, веб-приложение, интернет-магазин.
У меня есть Vistors / сеанс, данные транзакций и т. Д. И храню это; но если я хочу давать рекомендации на лету, я не могу запускать медленные карты / сокращать задания для этого в какой-то большой базе данных, которая у меня есть. Где я могу узнать больше об аспектах инфраструктуры? Я думаю, что я могу использовать большинство инструментов самостоятельно, но объединение их друг с другом кажется искусством само по себе.
Существуют ли общедоступные примеры / варианты использования и т. Д.? Я понимаю, что отдельные конвейеры сильно зависят от варианта использования и пользователя, но только примеры, вероятно, будут очень полезны для меня.