У нас есть hdfs емкостью 900 ТБ. Поскольку хранящиеся данные постоянно растут, трудно отслеживать, что полезно и что можно удалить. Я хочу проанализировать использование hdfs для следующего шаблона, чтобы можно было оптимально использовать емкость.Как получить отчет об использовании hdfs в деталях
- Каковы часто используемые данные.
- Данные не касаются/недоступны в течение длительного времени (Возможный кандидат для удаления)
- Распространение данных пользователями.
- Активные пользователи.