Вопрос: Как я могу прочитать во многих PDF-файлах по тому же пути, используя пакет Python «slate»?Python - Как преобразовать многие отдельные PDF-файлы в текст?
У меня есть папка с более чем 600 PDF-файлами.
Я знаю, как использовать пакет шифера для преобразования одиночных файлов PDF в текст, используя этот код:
migFiles = [filename for filename in os.listdir(path)
if re.search(r'(.*\.pdf$)', filename) != None]
with open(migFiles[0]) as f:
doc = slate.PDF(f)
len(doc)
Однако, это ограничивает Вас в один PDF в то время, заданный «migFiles [0]» - 0 - первый PDF-файл в файле пути.
Как я могу читать во многих PDF-файлах текст сразу, сохраняя их как отдельные строки или txt-файлы? Должен ли я использовать другой пакет? Как я могу создать цикл «for» для чтения во всех PDF-файлах в пути?
Кто бы ни проголосовал, дайте ему повод ... –