Я пытаюсь извлечь текст страницы 5 в pdf.
В pdf есть шрифт YLJAAA + CMSY10, который не имеет сопоставлений (CMap) или даже кодировок (кодировка по умолчанию или/Различия).
При извлечении текста после строки «tetex package» CGPDFScanner возвращает символ «\ x15», который встречается много раз.
Когда этот символ встречается, текущий шрифт - это вышеупомянутый шрифт, который не имеет ничего, чтобы извлечь текст из строки pdf. Что это за символ \ x15?CGPDFScanner - символ x15 во время сканирования
Спасибо.
Но его появление после текста «tetex package» на стр. 5, у которого нет пули после него. После этого у него есть оператор ge. CGPDFScanner считывает неверные данные? – Swaroop
Это то, что вы получаете за предоставление неполной и запутанной информации. Я отрегулирую свой ответ (хотя большая часть этого не меняется). – usr2564301
Я упомянул об этом в моем вопросе – Swaroop