При попытке исправить файл PML (Palm Markup Language), похоже, что у моего тестового файла есть символы, отличные от ASCII, которые заставляют MakeBook жаловаться. Решение состоит в том, чтобы разделить все символы, отличные от ASCII, в PML.Как удалить расширенный ascii с помощью python?
Таким образом, в попытке исправить это в Python, у меня есть
import unicodedata, fileinput
for line in fileinput.input():
print unicodedata.normalize('NFKD', line).encode('ascii','ignore')
Однако это приводит к ошибке, что линия должна быть «юникода, не ул». Вот фрагмент файла.
\B1a\B \tintense, disordered and often destructive rage†.†.†.\t
Не совсем уверен, как правильно пройти линию, подлежащую обработке в этой точке.
Вы хотите, чтобы отфильтровать любой символ, чей ASCII значение больше, чем 255? –
Строго говоря, нет такой вещи, как Extended ASCII. ASCII определяет значения от 0 до 127. Все, что выше этого, может быть интерпретировано произвольно. Возможно, вы должны использовать термин * не-ASCII-символы *. – dreamlax
Связанный: Функция безопасного выхода для вывода терминала http://stackoverflow.com/questions/437476/safe-escape-function-for-terminal-output – jfs