Чтобы добавить к другому ответу, ведение журнала по-прежнему является основным вариантом использования, как и поиск, но теперь метрики и аналитика становятся более важными.
Я считаю, что в этом посте суммируются изменения на рынке, которые стимулируют новые варианты использования больших данных. Все, что вам действительно нужно знать о базах данных с открытым исходным кодом
С появлением Web 2.0 статические веб-страницы стали динамическими, и социальные сети повсюду вокруг нас. Все пишут в Твиттере, публикуют сообщения, ведут блог, ведут видеоблог, делятся фотографиями, болтают и комментируют. Появляется Интернет вещей (IoT) - быстрорастущая сеть подключенных устройств, которые собирают и обмениваются данными, например сенсоры и интеллектуальные устройства. Здесь есть несколько отличных примеров.
В целом это генерирует огромные объемы новых данных, которые компании хотят усвоить и использовать, чтобы оставаться впереди, чтобы предоставлять такие функции, как рекомендации по продуктам и лучшее обслуживание клиентов. Данные можно анализировать в поисках шаблонов для таких приложений, как обнаружение мошенничества и поведенческая аналитика. Большая часть новых данных неструктурирована, а это означает, что их нельзя аккуратно хранить в табличной базе данных.
Представьте, что вы пытаетесь создать базу данных для хранения данных о ваших покупках в магазине - что вам нравится, как часто вы это покупаете, предпочитаете ли вы молоко или сливки с кофе. Для хранения новых данных необходимы новые типы баз данных, они должны быть нереляционными и в идеале недорогими. Звоните в колокола? Не реляционный, как в NoSQL, и недорогой, как в открытом исходном коде.
Один из архитекторов Elasticsearch, с которым я разговаривал, сказал, что 80% данных, с которыми Elasticsearch работает в компаниях, неструктурированы, а 20% - структурированы. Это неструктурированные данные, на которые компании обращают внимание, чтобы обнаружить редкие или необычные шаблоны данных. Они также используют Elasticsearch для отслеживания шаблонов данных. Например, крупный розничный торговец отслеживает в реальном времени с помощью Elasticsearch, чтобы обеспечить достаточное количество денег в магазинах, чтобы люди могли обналичивать чеки в дни зарплаты.
По моему собственному опыту с нашим вариантом использования поиска, мы не только используем нечеткий поиск, но он превратился в автозаполнение и быстрый поиск. Из того, что я видел, как только вы начнете работать с Elasticsearch, вы начнете развиваться в другие варианты использования, которые дополняют то, что у вас уже есть. Теперь, когда мы создали Elasticsearch как нечеткую поисковую систему в нашей компании, у нас теперь есть другие команды, занимающиеся аналитикой и метриками для ведения журналов.
Вот несколько дополнительных ресурсов, которые более подробно освещают эту тему: