Ответы:
Проверьте это для получения дополнительной информации.
Из предыдущей ссылки:
База данных
Хранилище данных
Также важно отметить, что хранилища данных могут быть получены от нуля до многих баз данных.
С нетехнической точки зрения: база данных ограничена определенными приложениями или набором приложений.
Хранилище данных - это хранилище данных уровня предприятия. Он будет содержать данные из всех / многих сегментов бизнеса. Он собирается поделиться этой информацией, чтобы обеспечить глобальную картину бизнеса. Это также важно для интеграции между различными сегментами бизнеса.
С технической точки зрения: слово «Хранилище данных» не имеет признанного определения. Лично я определяю хранилище данных как набор витрин данных. Где каждый витрина данных состоит из одной или нескольких баз данных, где база данных специфична для определенного набора проблем (приложения, набора данных или процесса).
Проще говоря, база данных является компонентом хранилища данных. Есть много мест, где можно исследовать эту концепцию, но поскольку нет «определения», вы найдете проблемы с любым ответом, который вы дадите.
Хранилище данных - это ТИП базы данных.
В дополнение к тому, что люди уже сказали, хранилища данных, как правило, представляют собой OLAP, с индексами и т. Д., Настроенными для чтения, а не записи, и данные нормализуются / преобразуются в формы, которые легче читать и анализировать.
Некоторые люди говорят, что «базы данных» такие же, как OLTP - это не так. OLTP, опять же, это ТИП базы данных.
Другие типы «баз данных»: текстовые файлы, XML, Excel, CSV ..., плоские файлы :-)
It is a logical subset of Data warehouse, generally based upon business functions.
Самый простой способ объяснить это - сказать, что хранилище данных состоит не только из базы данных. База данных - это набор данных, организованных каким-либо образом, но хранилище данных организовано специально для «облегчения отчетности и анализа». Это, однако, не вся история, поскольку хранилище данных также содержит «средства для извлечения и анализа данных, для извлечения, преобразования и загрузки данных, а также для управления словарем данных, также считаются важными компонентами системы хранилища данных».
База данных : - OLTP (процесс онлайн транзакций)
Datawarehouse
Хранилище данных и база данных. Хранилище данных специально разработано для анализа данных, которое включает в себя чтение больших объемов данных, чтобы понять взаимосвязи и тенденции в данных. База данных используется для сбора и хранения данных, таких как запись деталей транзакции.
Хранилище данных: подходящие рабочие нагрузки - аналитика, отчетность, большие данные. Источник данных - данные, собранные и нормализованные из многих источников. Сбор данных - Операции с массовой записью, как правило, по заранее заданному расписанию. Нормализация данных - денормализованные схемы, такие как схема Star или схема Snowflake. Хранение данных - оптимизировано для простоты доступа и высокоскоростного запроса. производительность с использованием столбчатого хранилища. Доступ к данным - оптимизирован для минимизации ввода-вывода и максимизации пропускной способности.
База данных транзакций: Подходящие рабочие нагрузки - Обработка транзакций. Источник данных - данные, полученные как есть, из одного источника, такого как транзакционная система. Сбор данных - Оптимизирован для непрерывных операций записи, поскольку новые данные доступны для максимизации пропускной способности транзакций. Нормализация данных - Сильно нормализованные, статические схемы. Хранение данных - Оптимизировано для большого количества операций записи в один ориентированный на строки физический блок. Доступ к данным - большие объемы небольших операций чтения.
Любое хранилище данных для приложения обычно использует базу данных. Это может быть реляционная база данных или нет базы данных sql, которые в настоящее время находятся в тренде.
Хранилище данных также является базой данных. Мы можем назвать базу данных хранилища данных как специализированное хранилище данных для целей аналитической отчетности для компании. Эти данные используются для ключевых бизнес-решений.
Упорядоченные данные помогают эффективно составлять отчеты и принимать деловые решения.
База данных:
Используется для оперативной обработки транзакций (OLTP).
Хранилище данных:
Используется для онлайн-аналитической обработки (OLAP).
Хранилище данных (DW) - это процесс сбора данных из различных источников и управления ими для обеспечения значимого понимания бизнеса. Хранилище данных обычно используется для подключения и анализа бизнес-данных из разнородных источников. Хранилище данных является ядром системы BI, которая построена для анализа данных и отчетности.
Источником для Хранилища данных может быть кластер баз данных, поскольку базы данных используются для процесса онлайн-транзакций, например, для хранения текущих записей. Но в Хранилище данных хранятся исторические данные, предназначенные для аналитического процесса в Интернете.
Хранилище данных - это тип структуры данных, обычно размещаемой в базе данных. Хранилище данных ссылается на модель данных и тип данных, которые там хранятся - данные, которые моделируются (модель данных) для аналитических целей сервера.
База данных может быть классифицирована как любая структура, которая содержит данные. Традиционно это будет СУБД, такая как Oracle, SQL Server или MySQL. Однако база данных также может быть базой данных NoSQL, такой как Apache Cassandra, или столбчатой MPP, такой как AWS RedShift.
Вы видите, что база данных - это просто место для хранения данных; Хранилище данных - это особый способ хранения данных, который служит определенной цели, которая заключается в обслуживании аналитических запросов.
OLTP против OLAP не говорит вам разницы между DW и базой данных, и OLTP и OLAP находятся в базах данных. Они просто хранят данные по-разному (разные методологии модели данных) и служат разным целям (OLTP - записи транзакций, оптимизированные для обновлений; OLAP - анализ информации, оптимизированные для чтения).
См. Простыми словами: информационное обеспечение -> огромные данные, используемые для аналитики / хранения / копирования и анализа. База данных -> операция CRUD с часто используемыми данными.
Dataware house - это тип хранилища, которым вы не пользуетесь ежедневно, а Database - это то, чем вы часто пользуетесь.
Например. Если мы просим выписку банка, то она дает нам за последние 3/4/6 / более месяцев, потому что она находится в базе данных. Если вы хотите больше, чем это хранит на Dataware House.
Пример: дом стоит $100,000
, и он ценится $1000
за год.
Чтобы отслеживать текущую стоимость дома, вы должны использовать базу данных, поскольку значение будет меняться каждый год.
Через три года вы сможете увидеть стоимость дома, который $103,000.
Чтобы отслеживать историческую стоимость дома, вы должны использовать хранилище данных, так как стоимость дома должна быть
$100,000 on year 0,
$101,000 on year 1,
$102,000 on year 2,
$103,000 on year 3.