Для ORM, поддерживающего проверку данных, должны ли ограничения также применяться в базе данных?


13

Я всегда применял ограничения на уровне базы данных в дополнение к моим (ActiveRecord) моделям. Но мне было интересно, действительно ли это требуется?

Немного фона

Недавно мне пришлось провести модульное тестирование базового метода автоматической генерации меток времени для модели. Обычно тест создает экземпляр модели и сохраняет его без проверки. Но есть и другие обязательные поля, которые нельзя обнулять в определении таблицы, то есть я не могу сохранить экземпляр, даже если пропущу проверку ActiveRecord. Поэтому я думаю, стоит ли мне удалять такие ограничения из самой базы данных и позволить ORM их обрабатывать?

Возможные преимущества, если я пропущу ограничения в db, imo -

  • Может изменить правило проверки в модели без необходимости переноса базы данных.
  • Может пропустить проверку в тестировании.

Возможный недостаток?

Если возможно, что проверка ORM окажется неудачной или будет обойдена, база данных не проверяет наличие ограничений.

Как вы думаете?

РЕДАКТИРОВАТЬ В этом случае я использую Yii Framework , который генерирует модель из базы данных, следовательно, правила базы данных также генерируются (хотя я всегда мог написать их и сам после генерации).


3
Если данные в вашей базе данных можно регулярно изменять без использования ORM (другие приложения без ORM или, что еще хуже, прямой доступ к базе данных пользователями), проверка действительно должна быть в базе данных.
Марьян Венема

Ответы:


16

Ваш руководящий принцип должен звучать так: « Не повторяй себя» :

В разработке программного обеспечения «Не повторяйся сам» (DRY) - это принцип разработки программного обеспечения, направленный на сокращение повторения информации всех видов, особенно полезный в многоуровневых архитектурах. Принцип СУХОЙ гласит: «Каждая часть знаний должна иметь одно, однозначное, авторитетное представление в системе».

ORM - это, по сути, дополнительный уровень (или уровень, если вы предпочитаете), удобно расположенный между вашим приложением и хранилищем данных. Ваши ограничения должны быть в одном месте и только в одном месте, будь то ORM или хранилище данных, в противном случае достаточно скоро вы будете поддерживать разные их версии. Вы действительно не хотите этого делать.

Однако на практике большинство полуприличных ORM автоматически генерируют большую часть ваших моделей из вашей схемы данных. Хотя дублирование все еще существует, шансы на адское обслуживание минимальны, поскольку дублированный код ORM генерируется по одному и тому же шаблону каждый раз. Было бы идеально, если бы не было дублирующегося кода, но автоматически генерируемые ограничения - это следующая лучшая вещь.

Кроме того, наличие ограничений в одном месте не обязательно означает, что все ограничения должны быть в одном месте. Некоторые, такие как ограничения ссылочной целостности, могут быть более подходящими для хранения данных (но могут быть потеряны при переходе на другое хранилище данных), а некоторые, в основном те, которые касаются сложной бизнес-логики, больше подходят для вашего ORM. Было бы предпочтительнее иметь все свои яблоки в одной корзине, но ...

Отказы

Вы упоминаете, что ORM не работает. Это абсолютно не имеет отношения к вашему вопросу, ваше приложение должно воспринимать ORM и хранилище данных как единое целое. В случае сбоя произошел сбой, поэтому обходить ORM для непосредственного общения с хранилищем данных не очень хорошая идея.

В обход ORM для всего остального

Также не очень хорошая идея. Однако это может произойти по разным причинам:

  1. Устаревшие части приложения, созданные до появления ORM.

    Это жесткая один, и именно в такой ситуации я имею дело с прямо сейчас , поэтому моим постоянным повтором «поддерживающей ад». Либо вы продолжаете поддерживать части, отличные от ORM, либо переписываете их для использования ORM. Второй вариант может иметь больше смысла на начальном этапе, но это решение, основанное исключительно на том, что именно делают эти части вашего приложения, и насколько ценной будет полная перезапись в долгосрочной перспективе.

    Попробуйте изменить ключ в плохо спроектированной таблице MySQL с 2 * 10 ^ 8 строками (без простоя), и вы поймете, откуда я.

  2. Не унаследованные части приложения, которым абсолютно необходимо напрямую общаться с хранилищем данных:

    Еще сложнее. ORM - это модные инструменты, и они заботятся почти обо всем, но иногда они просто мешают или даже абсолютно бесполезны. Модное слово (действительно, модная фраза) - это несоответствие объектно-реляционного импеданса , попросту говоря, технически ORM не может делать все, что делает ваша реляционная база данных, а для некоторых вещей, которые они делают, существует значительное снижение производительности.

Комментарии

С точки зрения целостности данных, ограничения ДОЛЖНЫ быть на базе данных, и ДОЛЖНЫ быть на приложении. Что делать, если доступ к вашему приложению осуществляется через веб-приложение и приложение для настольного компьютера, мобильное приложение или веб-сервис? - Луис Дамим

Вот где добавление дополнительного слоя было бы чрезвычайно полезно, и если мы говорим о веб-приложении, я бы пошел с REST API. Чрезмерно упрощенный дизайн для этого было бы:

введите описание изображения здесь

ORM будет находиться между API и хранилищами данных, и все, что находится за API (включая его), будет рассматриваться как единое целое из различных приложений.


Обычно вы определяете схему в своем ORM, которая затем отражается в базе данных, чтобы у вас был второй уровень гарантии.
Джош К

2
@JoshK Вы говорите, второй уровень гарантии, я говорю, черт возьми, обслуживание. Не говоря, что ты не прав, хотя ...
Яннис

Имеет смысл. Я сейчас иду по этому маршруту. Благодарность!
на

1
Как только вы пересекаете точку, когда один или два разработчика работают с кодом и базой данных, это становится неизбежным злом. Если вы используете хороший ORM, он также будет генерировать миграции для вас. Когда вы дойдете до того, что у вас будет выделенный администратор базы данных, у вас не будет пути к этому, они не позволят таблицам перемещаться без ограничений. Простой способ запретить людям подписываться без электронной почты - это ограничение уровня хранилища.
Джош К

1
С точки зрения целостности данных, ограничения ДОЛЖНЫ быть на базе данных, и ДОЛЖНЫ быть на приложении. Что делать, если доступ к вашему приложению осуществляется через веб-приложение и приложение для настольного компьютера, мобильное приложение или веб-сервис?
Луис Дамим

20

На самом деле это очень сложный вопрос, и я считаю его очень спорным вопросом.

Как отметил в своем ответе Яннис Ризос, имея логику ограничений как в базе данных, так и на уровне ORM , по-видимому, нарушает DRY, что «может привести к кошмарам обслуживания, плохому факторингу и логическим противоречиям».

Однако удаление логики ограничений из базы данных и сохранение ее только на уровне ORM не будет работать, если у вас есть любое из следующих условий:

  1. Ручные обновления БД (они, кажется, происходят в каждой компании)

  2. Обновления БД из другой системы, которая не всегда может легко совместно использовать логику ограничения ORM (например, скрипт Perl, который выполняет рутинные задачи, когда уровень ORM реализован в Hibernate и используется приложением Java для повседневной деятельности)

Это предполагает, что вы только добавляете логику ограничения в БД и удаляете ее из уровня ORM , чтобы предотвратить нарушение DRY. Однако это может привести к случаям, когда код приложения не сможет успешно перехватить реальную проблему и передать ее пользователю (хотя, как разработчик, скорее всего, отладит проблему). Это может быть неприемлемо для некоторых проектов.

Последний вариант - автоматизировать создание ограничений в ORM (и любой другой системе) из ограничений БД (или, на самом деле ... наоборот). Хотя в конечном итоге вы получите две или более реализации ограничений, это не будет нарушением принципа DRY, как описано в «Прагматичном программисте», поскольку они рекомендуют использовать генерацию кода, чтобы избежать нарушений DRY. Конечно, это не так просто, потому что, например, каждое изменение в ограничении БД может привести к повторной сборке и повторному развертыванию всех ваших приложений, которые его используют (не просто для автоматизации).

Действительно, это должно быть оценено в каждом конкретном случае . Я могу сказать вам, что до этого момента меня встречали пустые взгляды, когда я предлагаю, чтобы логика ограничений не повторялась.


2
Просто ушел с работы и думал о расширении моего ответа, чтобы он стал более или менее тем, что вы только что опубликовали. Хороший ответ!
Яннис

3

Я бы определенно добавил ограничения в базу данных в качестве варианта по умолчанию. Это связано с тем, что для предприятия важны данные, а качество данных имеет первостепенное значение. @ Яннис Ризос привнес принцип СУХОГО в обсуждение. Ну, другой принцип - защита в глубине. Для данных я бы использовал этот принцип.

Я работал на реальных предприятиях, где БД имеет данные, созданные 30 лет назад. Это было и до сих пор доступно приложению COBOL, а теперь - приложению .Net. Через 10 лет это может быть приложение поставщика, кто знает. Произошло слияние, и миллионы строк данных были преобразованы и перенесены из другой компании в эту базу данных с использованием SQL. Ни один ORM не может сделать это. Суть в том, что данные остаются, приложения меняются, изменяются способы генерирования данных. Так почему бы не уменьшить вероятность повреждения данных?


2

Я думаю, что вы делаете оба в некоторой степени.

  • Основные ограничения должны существовать в ORM - языки программирования гораздо более гибкие, их легче тестировать и легче настраивать при изменении требований; не нужно беспокоиться об исправлениях DDL по крайней мере. И вы, как правило, избегаете проблем с регрессией данных.

  • Некоторые очень жесткие и быстрые ограничения должны также существовать в базе данных. Я не говорю о ненулевых именах, например. Я говорю о вещах, таких как ссылочная целостность или требующих некоторых абсолютно важных идентификаторов. Структурные требования, поэтому вашему коду не нужно иметь дело с «что, если в Ордене нет несуществующего продукта».


1

База данных является IMO единственным местом, где DRY может быть нарушен, потому что, если что-то обходит ваш ORM и содержит неверные данные, это все. Игра закончена. Повреждение данных - смертельный удар.


База данных только? Я могу вспомнить много случаев, когда поведение, связанное с данными, должно существовать на нескольких уровнях (логическом или физическом), даже если данные вообще не сохраняются. Иногда возможно иметь один исходный код и уменьшить «дублирование» до развернутых DLL.
mike30
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.