У меня есть 3 терабайта, более 300 000 справочных файлов всех размеров (20, 30, 40, 200 мегабайт каждый), и я обычно регулярно их поддерживаю (не застегивал молнию). Несколько месяцев назад я потерял некоторые файлы, вероятно, из-за деградации данных (как я сделал «резервное копирование» поврежденных файлов без уведомления).Контрольная сумма SFV/CRC32 хорошая и достаточно быстрая, чтобы проверять общие файлы резервных копий?
Я не забочусь о безопасности, поэтому мне не нужны MD5, SHA и т. Д. Я просто хочу быть уверенным, что файлы, которые я копирую, хороши (одни и те же биты и байты) и убедитесь, что резервные копии не повреждены после за несколько месяцев до повторного создания резервных копий.
Таким образом, мои потребности являются базовыми, потому что файлы не очень важны, и нет необходимости в безопасности (без конфиденциальной информации). Мое сомнение: формат/метод «SFV CRC/32» хорош и быстро для моих нужд? Что-то лучше и быстрее? Я использую программу ExactFile.
Есть ли контрольная сумма быстрее, чем SFV/CRC32, но это не является недостатком? Я пытался использовать MD5, но он медленный, и поскольку мне не нужна безопасность данных, я предпочел SFV/CRC32. Тем не менее, это больно, потому что есть более 300 000 файлов и занимает несколько часов, чтобы сделать контрольную сумму всех из них, даже с процессором xeon 8 ядер HT и быстрым жестким диском.
С точки зрения целостности данных есть некоторые преимущества в объединении всех файлов в одном .ZIP или .RAR вместо того, чтобы позволить им «свободно» в папках и файлах?
Некоторые советы?
Спасибо!
Марк Адлер, благодарю вас за разъяснение. У меня есть файлы здесь с 1997 года, и я копировал с HDD на HDD. Поэтому всегда нужно использовать контрольную сумму, чтобы убедиться, что все в порядке. По сей день у меня никогда не было больших потерь (только несколько поврежденных файлов), но я каждый день параноик с резервными копиями. Одна вещь, которую я быстро узнал, никогда не сжимает файлы. Что касается «ложного положительного», это означает, что даже если контрольная сумма правильная, некоторые файлы могут быть повреждены? Опять же, спасибо за разъяснение. – Maldon
Да, ложным положительным будет случай, когда в файле есть только правильные ошибки, чтобы вернуть CRC в исходное значение. Если файл поврежден, вероятность случайности в этом случае очень мала, около 2^(- 32).Поскольку количество поврежденных файлов в вашем случае кажется очень маленьким, вероятность того, что эта вероятность будет приемлемой. –