Итак, я установил PDF Parser (http://www.pdfparser.org/). Я проверил их сайт и использовал демо. Это дало мне результат, который я хотел. После нескольких часов поиска, как использовать композитора, мне, наконец, удалось заставить его работать. Теперь я застрял в следующей проблеме, как получить результат из демонстрации.Результат поиска «Smalot PDF Parser»: текст не в той же строке
Я использовал код примера, указанный на странице документации. Он извлек текст, но весь текст находится на одной строке. Когда я использую демо, каждая новая страница начиналась с нового абзаца, и каждый фрагмент текста помещался в отдельную строку. Код:
<?php
// Include Composer autoloader if not already done.
include 'vendor/autoload.php';
// Parse pdf file and build necessary objects.
$parser = new \Smalot\PdfParser\Parser();
$pdf = $parser->parseFile('document.pdf');
// Retrieve all pages from the pdf file.
$pages = $pdf->getPages();
// Loop over each page to extract text.
foreach ($pages as $page) {
echo $page->getText();
}
?>
Как я уже говорил, когда использовал код выше, я получил весь текст на одной строке. Мой вопрос: как получить тот же результат, что и скрипт на демо-странице?