Я использую Caliber для преобразования PDF в MOBI, но у него есть проблемы с интерпретацией пространственно-вдавленных блоков кода. Блоки содержат много пространств, но в большом количестве. Некоторые строки имеют отступы на 31 пробел.Как заменить определенное количество пробелов с помощью регулярного выражения?
Caliber позволяет выполнять 3 регулярных выражения для поиска и замены в книге до ее преобразования.
Это то, что я пробовал.
\n(*) (*)([a-zA-Z{};\*\/\(\)�-9])
Заменить:
\n\1 \2\3
Проблема, она заменяет только один из пространств. Я хочу, чтобы все они были заменены тем же номером
.
Я также попытался ленивые версии первой группы и т.д.
Является ли это один из тех случаев, когда регулярные выражения являются недостаточными? Я думаю, что этот механизм регулярных выражений является стандартом python.
Теперь это выглядит лучше. Я никогда не получу идеальный результат, но это определенно читаемо, спасибо :-) – Steinbitglis
@Steinbitglis: Добро пожаловать. Я рад слышать это. :-) – ruakh
Быстрые и грязные хаки на помощь! –