Создание тестовых данных в базе данных [закрыто]

Мне известны некоторые генераторы тестовых данных, но большинство, кажется, просто заполняют базы данных имен и стилей адресов [не стесняйтесь меня поправлять].

У нас есть большое интегрированное и нормализованное приложение - например, счета-фактуры имеют номера деталей, связанные с таблицами запасов, номера клиентов, связанные с таблицами клиентов, журналы изменений, связанные с информацией аудита, и т. Д., Которые, очевидно, трудно заполнить случайным образом. В настоящее время мы запутываем реальные данные, чтобы получить тестовые данные (но не очень хорошо).

Какие инструменты \ методы вы используете для создания больших объемов данных для тестирования?

19.08.2008 14:47:58
6 ОТВЕТОВ

Там, где я работаю, мы используем RedGate Data Generator для генерации тестовых данных.

Так как мы работаем в банковской сфере. Когда нам приходилось работать с номинативными данными (номера кредитных карт, личный идентификатор, номера телефонов), мы разрабатывали приложение, которое может маскировать эти поля базы данных, чтобы мы могли работать с ними как с реальными данными.

Я могу сказать, что с Redgate вы можете приблизиться к тому, как ваши реальные данные могут выглядеть на рабочем сервере, поскольку вы можете настроить каждое поле каждой таблицы в вашем BD.

8
11.03.2015 03:37:03

Джоэл также упомянул RedGate в подкасте № 11

0
19.08.2008 15:03:26

Продукт Red Gate хорош ... но не идеален.

Я обнаружил, что мне лучше, когда я написал свои собственные инструменты для генерации данных. Я использую его, когда хочу создать, скажем, «Клиенты» ... но не очень хорошо, если вы хотите имитировать случайность, с которой клиенты могут участвовать, например, при создании заказов ... некоторые с одним элементом, а другие с несколькими.

Доморощенные инструменты предоставят наиболее «реалистичные» данные, как мне кажется.

1
19.08.2008 17:06:30
Наш инструмент для генерации тестовых данных «Advanced Data Generator» генерирует реалистичные данные: названия компаний, фамилии и имена, адреса электронной почты, названия улиц, названия городов и многое другое. Смотрите upscene.com/go/?go=adg
Martijn Tonies 7.02.2013 11:03:36

Вы можете создавать планы данных с помощью VSTS Database Edition (с последними инструментами Power 2008).

Он включает в себя мастер создания данных, который позволяет автоматически генерировать данные, указывая на существующую базу данных, чтобы вы получили что-то реалистичное, но содержащее совершенно другие данные

3
19.08.2008 19:13:41

Я только что завершил проект по созданию более 3 500 000 заявок на страхование здоровья. Из-за ограничений HIPPA и PHI использование даже очищенных реальных данных является PITA. Для этого я использовал инструмент под названием Datatect ( http://www.datatect.com/ ).

Некоторые вещи, которые мне нравятся в этом инструменте:

  1. Использует ODBC, чтобы вы могли генерировать данные в любой источник данных ODBC. Я использовал это для баз данных Oracle, SQL и MS Access, простых файлов и таблиц Excel.
  2. Расширяется с помощью VBScript. Вы можете писать хуки в различных частях рабочего процесса генерации данных, чтобы расширить возможности инструмента. Я использовал эту функцию для «синхронизации» зависимых столбцов в базе данных и для управления распределением частот по значениям, чтобы выровнять их с наблюдаемыми в реальном мире частотами.
  3. Ссылка в курсе. При заполнении столбцов внешнего ключа извлекает действительные ключи из родительской таблицы.
2
1.10.2008 14:26:45

Я свернул свой собственный генератор данных, который генерирует случайные данные, соответствующие регулярным выражениям. Основная идея состоит в том, чтобы использовать правила проверки дважды. Сначала вы используете их для генерации действительных случайных данных, а затем вы используете их для проверки нового ввода в производство. Я написал переписать утилиту, так как это похоже на хороший учебный проект. Это доступно в googlecode .

3
25.10.2008 06:16:28