Наши больничные системы имеют таблицу для документов, а страницы также перечислены отдельно. Таким образом, каждый документ/субтитр/DUID (уникальный идентификатор документа) будет указан для КАЖДОЙ страницы (стр. 1, стр. 2, стр. 3). Ниже приведен пример таблицы и то, что я пытаюсь выполнить.Поиск дубликатов многостраничных документов по отдельным идентификаторам
ID Global_ID document subtitle page DUID
-------------- -------------------- ----------------------- ------------------------------ ------ -------------
1 11111 IMAGING REPORT 20120723 6400 CR 1 1.2.840.....
2 22222222 RADIOLOGY 20110808 70012240000200 CH2V 1 1.2.840.111.
2 22222222 RADIOLOGY 20110808 70012240000200 CH2V 1 1.2.840.222.
3 333333 IMAGING REPORT 20120607 29006850002500 CH2V3 1 1.2.840.....
4 44444444 RADIOLOGY 20110816 70012240000300 CH1V 1 1.2.840.....
5 55555555 RADIOLOGY 20110817 70012240000400 CH1V 1 1.2.840.....
Я пытаюсь найти «повторы», например, ID # 2 в примере ... где идентификатор имеет две копии (каждая со своим собственным уникальным DUID) одной и той же комбинации документов/субтитров. Имейте в виду, я ограничил приведенные выше результаты «страницей 1» ... но это прекрасно, потому что это сократит общий результирующий набор. Кроме того, имейте в виду, что субтитры для двух разных идентификаторов могут совпадать, поэтому я не могу сделать простой COUNT(subtitle) > 1
Пожалуйста, помогите мне найти дубликаты, чтобы мы могли очистить наши записи!
Это было бы здорово, но я «Я все еще получаю повторы нескольких страниц # – DadoFaayan
@ user2460205 ну, вы сказали, что хотите найти повторы, и вот что делает этот запрос doin g – Lamak
повторяет, где страница = '1' – DadoFaayan