Предположим, что используется размер блока по умолчанию (128 МБ), и есть файл, использующий 130 МБ; поэтому используйте один полноразмерный блок и один блок с 2 МБ. Затем к файлу добавляется 20 МБ (сумма должна быть теперь 150 МБ). Что происходит?Как работает HDFS с append works
Действительно ли HDFS изменяет размер последнего блока с 2 МБ до 22 МБ? Или создать новый блок?
Как добавление к файлу в HDFS связано с непрозрачностью? Есть ли риск dataloss?
Создает ли HDFS третий блок, размещающий в нем 20 + 2 МБ, и удаляет блок с 2 МБ. Если да, то как это работает одновременно?
Можете ли вы добавить к закрытому файлу? – David
, если вы вызываете append в файл, который вы его открываете. вы не можете вызвать append в открытом файле. то, как только вы вызываете append и получаете выходной поток, вы можете начать сбрасывать свои байты в конец файла. – EthanP
Если я правильно помню, когда эта функция была введена, вам нужно было бы оставить только что созданный файл, чтобы он мог «добавить» к нему (он же не настоящий append). Вы говорите, что теперь HDFS позволяет: 1) создать файл 2) закрыть его 3) повторно открыть его 4) добавить данные к нему? – David