Я извлекаю текст из файлов PDF. это код:извлечь текст из pdf в php не работает для всех файлов PDF
<?php
require("PdfToText.php");
$file = 'SamplePF' ;
$pdf = new PdfToText ("$file.pdf") ;
echo ($pdf -> Text) ;
?>
Этот класс отлично подходит для некоторых PDF-файлов. Проблемы этого класса:
- для некоторых PDF-файлов это взять текст из случайной страницы/строк не в последовательности страницы мудро.
- для некоторых файлов PDF он не показывает никакого результата.
- для некоторых файлов PDF он извлекает только одну или две строки.
Пожалуйста, предложите какое-либо решение. Спасибо!
Некоторые PDF-файлы старше и не используют ту же структуру больше. Если у вас есть проблемы с этим, свяжитесь с Adobe, почему они не опубликовали публичный API для этого. – Xorifelse