Пример базы данных для упражнений [закрыт]

Я хотел бы поиграть с большой базой данных, чтобы проверить свои знания по SQL.

Есть ли огромный .sql, который я могу использовать, чтобы играть с SQL-запросами?

5.04.2009 16:33:02
«Огромный» довольно субъективен. Хотите предоставить более объективные рекомендации?
Bill the Lizard 5.04.2009 16:35:07
Кроме того - что значит «играть»? Вы хотите схему + данные, которые вы можете воспроизводить локально и изменять по своему усмотрению? Или вы просто хотите подключиться и написать запросы?
duffymo 5.04.2009 16:36:32
Огромная примерная база данных; seanlahman.com/baseball-archive/statistics
Ken Vors 5.10.2015 18:00:35
Я нашел фиктивную базу данных с 10 до 1М строк. Вот и вы: sample-videos.com/download-sample-sql.php
Miral Viroja 4.11.2015 19:23:24
Более десятка SQL-сценариев и файлов базы данных доступны для небольшой базы данных сотрудников по адресу github.com/cristiscu/employees-test-database
Cristi S. 27.09.2019 16:42:10
7 ОТВЕТОВ
РЕШЕНИЕ

Вы можете попробовать классическую мировую базу данных MySQL .

Файл world.sql доступен для скачивания здесь:

http://dev.mysql.com/doc/index-other.html

Просто прокрутите вниз до примера базы данных, и вы найдете его.

39
8.08.2012 11:05:30
Я отредактировал ответ, указав расположение файла world.sql.
karim79 5.04.2009 16:47:26
Кажется, переехали сюда: dev.mysql.com/doc/index-other.html
cbednarski 5.08.2010 23:45:09

Ознакомьтесь с CodePlex для проектов и примеров сообщества Microsoft SQL Server.

Стороннее редактирование

В верхней части ссылки выше вы можете посмотреть на

4
23.10.2016 20:17:16

Вы хотите огромный?

Вот небольшая таблица: создайте таблицу foo (id int не нулевой первичный ключ auto_increment, crap char (2000));

вставить в значения foo (crap) ('');

- при каждом запуске следующей строки число строк в foo удваивается. вставить в foo (дерьмо) выбрать * из foo;

запустите его еще двадцать раз, у вас есть более миллиона строк для игры.

Да, если он ищет взгляды на отношения, чтобы ориентироваться, это не ответ. Но если он хочет протестировать производительность и свою способность оптимизировать , он это сделает. Я сделал именно это (а затем обновил со случайными значениями), чтобы проверить потенциальный ответ, который у меня был на другой вопрос. (И не ответил на это, потому что я не мог придумать лучшую производительность, чем у того, кто просил.)

Если бы он попросил «сложный», я бы получил другой ответ. Для меня «огромный» подразумевает «много строк».

Потому что вам не нужно много играть с таблицами и отношениями. Рассмотрим таблицу без столбцов, которые можно обнулять. Сколько может быть разных видов строк? Только один, так как все столбцы должны иметь какое-то значение, так как ни один не может быть нулевым.

Каждый обнуляемый столбец умножается на два на количество возможных типов строк: строка, в которой этот столбец равен нулю, строка, в которой он не равен нулю.

Теперь рассмотрим таблицу, а не в изоляции. Рассмотрим таблицу, которая является дочерней таблицей: для каждого дочернего элемента, который имеет FK для родителя, то есть, многие к одному, может быть 0, 1 или много дочерних элементов. Таким образом, мы умножаем в три раза количество, полученное на предыдущем шаге (нет строк для нуля, один для ровно одного, два ряда для многих). Для любого бабушки и дедушки, для которых родителя много, еще трое.

Для отношений «многие ко многим» мы не можем иметь отношения «один к одному», «один ко многим», «многие к одному» или «многие ко многим». Таким образом, для каждого «многие ко многим», которого мы можем достичь на графике из таблицы, мы умножаем ряды на девять - или просто как два на однозначное число. Если многие-ко-многим также имеют данные, мы умножаем на число обнуляемости.

Таблицы, которые мы не можем найти в нашем графе - те, к которым у нас нет прямого или косвенного FK, не умножают строки в нашей таблице.

Путем рекурсивного умножения каждой таблицы, которую мы можем достичь, мы можем получить количество строк, необходимое для обеспечения одного из каждого «вида», и нам нужно не больше, чем те, чтобы проверить все возможные отношения в нашей схеме. И мы далеко не огромные.

-6
5.04.2009 17:38:38
Я думаю, он может искать что-то более реалистичное, полное смоделированных данных и взаимосвязей, а не просто гигантскую таблицу из ничего.
TheTXI 5.04.2009 16:44:22
Но это огромное, вы должны дать ему это :)
Joey 5.04.2009 16:50:34
-1 похоже, что ОП ищет большой объем кода SQL для чтения. ни одна строка не повторяется.
bendewey 5.04.2009 16:51:55
Если он пытается проверить производительность и свою способность оптимизировать, это сделает это. Я сделал именно это (а затем обновил со случайными значениями), чтобы проверить потенциальный ответ, который у меня был на другой вопрос.
tpdi 5.04.2009 17:03:17

Если вам нужна большая база данных реальных данных для игры, вы можете зарегистрироваться на конкурс Netflix Prize и получить доступ к их данным, которые довольно велики (несколько концертов).

Стороннее редактирование

Приведенный выше URL-адрес больше не содержит набор данных (октябрь 2016 года). На странице википедии о премии Netflix Prize сообщается, что судебный процесс был урегулирован в связи с вопросами конфиденциальности.

1
23.10.2016 20:06:05
Набор данных призового конкурса netflix, похоже, больше не доступен. Он состоит из 5-звездочных рейтингов 17770 фильмов и 480189 анонимных пользователей. Общее количество рейтингов - 100480507; зонд 1408395 является их подмножеством. взято из GrandPrize2009_BPC_BigChaos Приз получил команда-победитель Боб Белл, Мартин Хабберт, Майкл Ярер, Иегуда Корен, Мартин Пиотт, Андреас Тошер и Крис Волински. На заметку: загрузка форума
surfmuggle 23.10.2016 19:49:21

Почему бы не скачать английскую Википедию? Существуют сжатые файлы SQL разных размеров, и они должны быть достаточно большими для вас.

Основными статьями являются XML, поэтому вставка их в базу данных представляет собой небольшую проблему, но вы можете обнаружить, что есть другие файлы, которые вам подходят. Например, файл SQL межстраничных ссылок сжат в 2,3 ГБ. Загляните на https://en.wikipedia.org/wiki/Wikipedia:Database_download для получения дополнительной информации.

Oskar

3
18.08.2017 23:04:02

Это то, что я использую для изучения sql: employee-db

это пример базы данных со встроенным набором тестов, используемый для тестирования ваших приложений и серверов баз данных

Стороннее редактирование

Согласно launchpad.net база данных переместилась на github .

База данных содержит около 300 000 записей о сотрудниках с 2,8 млн. Записей о зарплате. Объем данных для экспорта составляет 167 МБ, что не так много, но достаточно тяжело, чтобы быть нетривиальным для тестирования.

Данные были сгенерированы, и как таковые есть несоответствия и тонкие проблемы. Вместо того, чтобы удалять их, мы решили оставить содержимое без изменений и использовать эти вопросы в качестве упражнений по очистке данных.

2
23.10.2016 20:26:08

Это онлайн-база данных, но вы можете попробовать использовать базу данных stackoverflow: http://data.stackexchange.com/stackoverflow/query/new

Вы также можете скачать его дампы здесь:

https://archive.org/download/stackexchange

5
28.10.2017 23:47:35
добавлена ​​ссылка, по которой можно скачать дампы. Я надеюсь, что это нормально.
miracle173 28.10.2017 19:03:30