У меня есть более миллиона текстовых файлов, сжатых в 40 ZIP-файлов. У меня также есть список из 500 имен моделей телефонов. Я хочу узнать количество случаев, когда конкретная модель упоминалась в текстовых файлах.Есть ли модуль python для сопоставления регулярных выражений в zip-файлах
Есть ли какой-либо модуль python, который может выполнять регулярное сравнение файлов без их разархивирования. Есть ли простой способ решить эту проблему без распаковки?
Абсолютно нет. Zip-файлы не сохраняются с кодировкой huffman, но со словарным кодированием. Кодирование символов зависит от кодировок других символов и их частоты в источнике. Таким образом, у этой техники нет никаких шансов на работу. – 2009-01-27 14:06:30