У меня есть маленькие файлы, ежедневно попадающие в hdfs. Я планирую использовать архив hadoop (HAR), но как я могу архивировать эти небольшие файлы, которые ежедневно попадают в hdfs. Например: я могу получить 5 файлов сегодня, мне нужно их архивировать, а завтра, если я получу еще 5 файлов, я должен добавить это в архив предыдущих дней.Архивирование входящих небольших файлов hdfs
0
A
ответ
2
Вы не можете добавлять файлы в существующие файлы HAR. Вам нужно в течение нескольких дней архивировать и переархивировать файлы пула, а также создавать архивные файлы.