Я пытаюсь преобразовать файлы синтаксиса SPSS в читаемый HTML. Он работает почти отлично, за исключением того, что (один) непечатаемый символ вставляется в файл HTML. Кажется, у него нет кода ASCII и он выглядит как крошечная точка. И это вызывает проблемы.Избегайте непечатаемого символа в html-файле, написанном Python
Это происходит (только) во второй строке HTML-файла, всегда соответствующей первой строке исходного файла. Которые, вероятно, намекает на какой линии (ы) Python вызывают проблемы (см комментарии)
код, который, кажется, вызывает это
rfil = open(fil,"r") #rfil = Read File, original syntax
wfil = open(txtFil,"w") #wfil = Write File, HTML output
#Line below causes problem??
wfil.write("<ol class='code'>\n<li>")
cnt = 0
for line in rfil:
if cnt == 0:
#Line below causes problem??
wfil.write(line.rstrip("\n").replace("'",''').replace('"','"'))
elif len(line) > 1:
wfil.write("</li>\n<li>" + line.strip("\n").replace("'",''').replace('"','"'))
else:
wfil.write("<br /><br />")
cnt += 1
wfil.write("</li>\n</ol>")
wfil.close()
rfil.close()
Снимок экрана результата
Что означает «причинение вреда» в данном случае? Я фундаменталист-утф-8. Когда вы читаете в python, попробуйте сначала преобразовать его в utf-8 или unicode. Когда вы выписываете, всегда используйте utf-8. Но я действительно не знаю, справляется ли этот совет с вашей проблемой. –
Вы можете удалить файл из непечатаемых файлов, используя: 'import string; ".join (s для s в foo, если s в string.printable)' [Дополнительная информация здесь] (http://stackoverflow.com/a/16402009/1076493) – timss
@AdrianRatnapala: «Причинение проблемы» означает, печатный символ, вероятно, вставлен этой строкой кода Python. Когда я просматриваю последнюю страницу HTML в браузере, она выглядит действительно странно, и именно это я пытаюсь исправить. – RubenGeert