Я работаю в среде, где я не могу ничего сохранить на диске. Мне нужно иметь возможность извлекать tar-файлы и разархивировать их без сохранения на диск. Это, кажется, не в состоянии:Использование Python, как вы распаковываете чисто в памяти?
Я попытался это, но она подбрасывает ошибки:
# fetch.py
from cStringIO import StringIO
import requests
url = "http://example.com/data.tar.gz"
response = requests.get(url)
# ERROR is thrown here. Error shown below
tar = tarfile.open(mode= "r:gz", fileobj = StringIO(response.content))
# This SHOULD break as tar.extract() saves to disk.
# Can't tell because of error on previous line of code.
data = tar.extract()
Как описано в блоке кода выше, я получаю следующее отслеживающий на линии ошибки:
Traceback (most recent call last):
File "<input>", line 1, in <module>
File "./importers/bestbuy_fetcher.py", line 23, in download_bestbuy_batch
tar = tarfile.open(mode= "r:gz", fileobj = StringIO(response.content))
File "/System/Library/Frameworks/Python.framework/Versions/2.6/lib/python2.6/tarfile.py", line 1662, in open
return func(name, filemode, fileobj, **kwargs)
File "/System/Library/Frameworks/Python.framework/Versions/2.6/lib/python2.6/tarfile.py", line 1711, in gzopen
**kwargs)
File "/System/Library/Frameworks/Python.framework/Versions/2.6/lib/python2.6/tarfile.py", line 1689, in taropen
return cls(name, mode, fileobj, **kwargs)
File "/System/Library/Frameworks/Python.framework/Versions/2.6/lib/python2.6/tarfile.py", line 1568, in __init__
self.firstmember = self.next()
File "/System/Library/Frameworks/Python.framework/Versions/2.6/lib/python2.6/tarfile.py", line 2324, in next
raise ReadError(str(e))
ReadError: invalid header
Вы получаете эту ошибку, потому что 'response.content' не является допустимым gzipped tar-файлом. – geoffspear
Это имеет смысл: так как я могу превратить его в действительный gzipped tar-файл? – pydanny
Работает для меня с действительный tar.gz, отправленный с localhost. Возможно, вы просто получите плохой архив. – codysoyland