Я выполняю несколько тестов в базе данных, и мне было интересно, есть ли общедоступные наборы данных, содержащие более 1Т строк?Trillion-row public dataset?
Я знаю, что в Google Big Query имеется несколько общедоступных наборов данных, которые представляют собой 100M + (wikipedia, gdelt-events) и 1B + (nyc-tlc) строки, но не могут найти ничего большего. Кто-нибудь знает о наборе данных в 1Т-строке, который можно загрузить или загрузить?
Несколько ссылок ссылки:
Выполнение большого количества обработки в наборе данных триллиона строк может быть дорогостоящим, особенно если вы не будете писать свои запросы тщательно. Сделайте несколько расчетов, прежде чем начать. –