Я пытаюсь открыть файл Warc с питоном, используя набор инструментов по следующей ссылке: http://warc.readthedocs.org/en/latest/открыт ВАКР файл с питоном
При открытии файла с:
import warc
f = warc.open("00.warc.gz")
все в порядке и объект Р:
<warc.warc.WARCFile instance at 0x1151d34d0>
Однако, когда я пытаюсь прочитать все в файле с помощью:
012 появляетсяfor record in f:
print record['WARC-Target-URI'], record['Content-Length']
следующая ошибка:
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/Users/xxx/anaconda/lib/python2.7/site-packages/warc/warc.py", line 390, in __iter__
record = self.read_record()
File "/Users/xxx/anaconda/lib/python2.7/site-packages/warc/warc.py", line 373, in read_record
header = self.read_header(fileobj)
File "/Users/xxx/anaconda/lib/python2.7/site-packages/warc/warc.py", line 331, in read_header
raise IOError("Bad version line: %r" % version_line)
IOError: Bad version line: 'WARC/0.18\n'
Является ли это потому, что моя версия ВАКР файл не поддерживается Warc инструментов, я использую или что-то другое?
Вот что говорит ошибка. – simonzack