Я видел это question, но мне нужно что-то еще.Перемещение большого файла tar.gz в python без его извлечения сначала
В моих файлах содержится очень много текстовых файлов (сотни тысяч), организованных по имени переменной. Что-то вроде
filename/maxvalue/IDXstation.txt (with X that goes from 100000 to 200000)
filename/minvalue/IDXstation.txt
filename/meanvalue/IDXstation.txt
и так далее. Проблема в том, что у меня нет файлов readme.txt, которые сообщают мне, сколько папок находится в файлах tar или как они названы (я их создал) (или сколько станций в каждой папке). Сейчас мне все равно читать это структура FILENAME.tar.gz и печати что-то вроде
filename/maxvalue/
filename/minvalue/
filename/meanvalue/
мне нужно прочитать ее структуру, прежде чем начать извлечение файла, потому что я заинтересован только в некоторые папки, а не все.
, если я использую
for tarinfo in tar:
print tarinfo.name
Он будет печатать все файлы, и они сотни тысяч, и я не хочу, но я не уверен, как настроить его.
Вы хотите напечатать все имена каталогов в архив? Какие папки вам интересны? – jfs
Да, имена каталогов до второго уровня (имеет смысл?) имя_файла/variablename/ – claire
Если вам нужно найти структуру, я предлагаю вам использовать стандартные инструменты командной строки. В любом случае вам нужно разархивировать поток данных, нет никакого способа обойти. После этого команда «tar» предоставляет множество опций, чтобы «заглянуть» в архив. –