Есть ли способ выполнить OCR при загрузке документа?Php - Загрузить документ, docx, pdf - извлечь весь контент
можно проиндексировать весь документ?
может содержать индекс поисковой системы всего документа? Хотя пользователи должны платить за просмотр полного документа?
Может ли документ отображаться в виде предварительного просмотра, только видимый отрывок, а остальные размыты, если формат документа остается видимым?
Я пытался найти легкие решения этих вопросов, используя простые функции php или что-то, что не могло бы показаться наукой о ракетах. Но везде, где я смотрю, я вижу, как люди говорят об ApachePOI и Solr Cell и обо всех этих командах сервера, о которых я понятия не имею. По последнему вопросу я мог только понять, что мы можем использовать PHPGD и генерировать изображения с размытым контентом, но я не был уверен, как это сделать, если в документе были отформатированный текст, изображения и таблицы и т. Д.
Так что, если у кого-то есть простые решения или даже сложные решения, но с инструкциями EASY, это будет сделано. Что-то вроде «извлечение содержимого документа php для noobs», которое начнется с a-b-c.
Спасибо заранее!
В этом вопросе слишком много обложки. Вы должны задать отдельный вопрос для каждой отдельной части этого. – Polynomial
Разве нет решения для подписчиков, которое удовлетворит все потребности? Как простая техническая техника извлечения, которая сделает все это? За исключением последнего вопроса, но это не главная проблема здесь и может быть проигнорировано. – salmanhijazi
Нет. Вам повезет найти lib, который охватывает более одного из них сразу, тем более, что вы спрашиваете о нескольких форматов документов. – Polynomial