У меня есть сценарий для распаковки и анализа данных, содержащихся в кучке очень больших сжатых файлов bzip2. Поскольку это может занять некоторое время, я хотел бы иметь какой-то способ контролировать прогресс. Я знаю, что могу получить размер файла с os.path.getsize()
, но bz2.BZ2File.tell()
возвращает позицию в несжатых данных. Есть ли способ получить текущую позицию в несжатом файле, чтобы я мог отслеживать прогресс?Как получить внутреннюю позицию при чтении файла bzip2
Бонусные баллы, если есть эквивалент python для Java ProgressMonitorInputStream
.
Меня интересует только подмножество данных в файлах, поэтому я не хочу их полностью распаковать. Я разбираю строки, когда читаю их и выводя только те части, которые меня волнуют. – job
ok Я думал, что вы скорее распечатываете свой файл, а затем разбираете его. Кажется, вы уже делали это правильно. – Dvx