Я использую Inkscape для преобразования одностраничных PDF-файлов в файлы SVG (в Windows).Как обеспечить Inkscape сохранение пробелов при преобразовании PDF-текста в SVG
Весь текст из PDF успешно конвертируется и отображается на странице точно так же, как и на входе, за исключением пробелов. Файлы SVG выглядят так же, как и входные документы, потому что текст правильно помещается атрибутами «x» в элементах «tspan», но внутренний текст tspan не имеет пробелов из PDF.
Например, если я выделяю эти три слова в PDF и вставить их, они появляются как:
Associated MET Office
Однако в результате SVG я получаю это:
<tspan
x="0 5.0025001 8.7524996 12.5025 16.672501 20.422501 22.0875 26.2575 28.342501 32.512501 38.48 44.727501 49.73 56.110001 61.945 64.029999 66.114998 67.779999 71.529999"
y="0"
id="tspan940">AssociatedMETOffice</tspan>
Я преобразование PDF из командной строки с использованием аргументов:
-z --export-plain-svg
Таким образом, пробелы, по-видимому, находятся в e PDF, но падает на Inkscape. Я искал тщетно для параметра командной строки с пробелами в резервировании, существует ли такая опция?
Копирование и вставка текста из PDF не нужно отражать то, что * внутри * ФПВ; фрагмент текста может иметь специализированную разметку «только для копирования». Также возможно, что процедура копирования в вашем средстве просмотра PDF распознает некоторое большое горизонтальное перемещение между двумя символами как пространство, где Inkspace этого не делает. Честно говоря, только гипотеза возможна, не видя PDF (и когда вы это знаете), вам придется поговорить с программистами Inkscape). – usr2564301
Просьба поделиться PDF-файлом для анализа. – mkl
mkl запросил источник PDF. Его можно найти здесь: http://www.ead.eurocontrol.int/eadbasic/pamslight-1EA7853C78ADE206A8C31818D7A6BCDE/7FE5QZZF3FXUS/EN/AIP/AD/EG_AD_2_EGTR_en_2014-08-21.pdf – RAM