Я ищу библиотеку (если возможно, на Java или PHP), чтобы извлечь текст из PDF. Существует много программного обеспечения доступны, в том числе:Извлечение текста из PDF: PDFLib vs PDF extract vs pdf2xml
3-Хайтс ™ PDF Extract http://www.pdf-tools.com/pdf/pdf-extract-content-metadata-text.aspx
PDFlib ТЕТ - Text Extraction Toolkit http://www.pdflib.com/products/tet/
Какие инструменты вы бы выбрали? Что ты о них думаешь?
Благодарим вас за помощь!