Какие инструменты существуют для генерации тестовых данных для SQL Server?


14

Как вы можете видеть из другого моего вопроса , генерация тестовых данных - моя тема прямо сейчас.

На данный момент я все еще генерирую свои тестовые данные вручную. Тем не менее, этот процесс всегда порождает небольшие объемы данных (обычно пять-десять строк) , так как он является ручным процессом.

Есть ли инструменты для автоматизации этого процесса? В частности, я хотел бы иметь возможность генерировать 1 миллион + строк.

Ответы:


5

Проекты базы данных Visual Studio можно использовать с планами генератора данных .

Хорошее видеоурок можно посмотреть здесь: Как мне: создать тестовые данные с помощью Visual Studio Team System Database Edition?


Мне нравится это, так как это наиболее легко для меня. Однако, чтобы использовать их, я буду вынужден перейти с VS2005 по крайней мере на 2008 год.
Ричард

2
Вам действительно нужно скачать виртуальную виртуальную машину VS2010 и собрать пакет для обновления. Инструменты базы данных (пакеты DAC для 2088R2, радость) достойны сами по себе. Полные инструменты ALM, если вы можете получить dev и протестировать на борту, революционные.
Марк Стори-Смит

@Devart вы можете оставить свой комментарий в качестве ответа. Это действительный.
Мариан


5

Отличным ресурсом, конечно же, является Redgate SQL Toolbelt, в частности их Data Generator.

SQL Data Generator - это быстрый и простой инструмент для генерации тестовых данных.

Используя имена таблиц и столбцов, длину полей, типы данных и другие существующие ограничения, SQL Data Generator сразу предоставляет разумные генераторы. Затем они могут быть настроены в соответствии с конкретными требованиями.

SQL Data Generator идеально подходит как для тестирования баз данных, так и для соблюдения требований законодательства о конфиденциальности. Он предоставляет тестовые данные быстро и просто.


4

Я отвечу на это так же, как и на вопрос о MySQL :

Вам часто лучше делать это самостоятельно, либо данные могут быть слишком случайными и не будут иметь распределения, аналогичного тому, как будут выглядеть ваши реальные данные. (например, индексы хороши для действительно случайных данных ... не так много, когда существует ограниченное число перестановок или некоторые значения встречаются более 20% времени)

Я обычно использую сценарии Perl для генерации своих смоделированных данных и записываю их в файлы с разделителями табуляции ... Затем я могу либо использовать механизмы массового импорта этой базы данных, чтобы загрузить ее, либо использовать другой сценарий, который вставляет записи с заданной частотой (например, insert (x) записывает каждые (y) секунды с небольшим джиттером времени)

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.