Я немного ограниченным количеством вычислений, потому что я не хочу убивать базу данных или пропускную способность при потере часов.выберите случайный ~ 100 миллионов строк миллиардов
мой текущий запрос что-то вроде этого:
SELECT TOP (100000000) mycolumns
FROM mydb
WHERE lower_control_limit> value1
AND upper_control_limit < value2 ;
Я не получаю приличную случайную выборку, но я боюсь положить команды, которые должны пройти миллиарды строк перед возвратом значения. Мне нужна единая случайная выборка над доменом (строками).
Что такое «лучшая практика» для вытягивания нескольких сотен миллионов строк из магазина с большим количеством миллиардов строк?
Я видел случайное, но я просто беспокоюсь о размере запроса и ограниченных вычислительных ресурсов и ресурсах пропускной способности.
Если удалить фильтр для ограничения вашего образца, она не вернется с результатами за минуты? Наверное, на данный момент это не «образец». – sean
Нет. Топит весь баран моей рабочей станции, и он замерзает. Потребуется около получаса, чтобы потянуть его. В итоге мне приходится убивать процесс. – EngrStudent
Вы тянете это в SSMS? Вы выполняете запрос с другой машины? – sean