Я обычно генерирую свои собственные, используя некоторые известные данные в качестве входных данных - если они слишком случайные, это не всегда хороший тест; Мне нужны данные, которые будут распространяться аналогично моему конечному продукту.
Все более крупные базы данных, которые мне нужно настроить, носят научный характер, поэтому я обычно могу взять в качестве входных данных какое-то другое исследование, изменить его масштаб и добавить дрожание. (например, взять данные, которые имели 5-минутную частоту с точностью до миллисекунды, и превратить их в 10-секундную частоту с точностью до миллисекунды, но с дрожанием +/- 100 мс до времени)
...
Но, в качестве другой альтернативы, если вы не хотите писать свои собственные, стоит взглянуть на некоторые из инструментов сравнения - так как они могут повторять вещи снова и снова на основе учебного набора, вы можете использовать их для вставки лотов. записей (а затем просто игнорировать отчеты о том, как быстро это было сделано) ... и затем вы можете использовать тот же инструмент для проверки скорости работы базы данных после ее заполнения.