2017-02-08 10 views
0

I.T. здесь сложно, но я пытаюсь выяснить, есть ли способ взять стандартный xml или html-файл и преобразовать все символы, используя только Notepad ++. Если я смогу сделать это без плагина, который был бы изящным. Я вижу, что я могу изменить кодировку в ANSI, но я не вижу возможности для ASCII, и я не думаю, что они точно такие же, не так ли? Xml/html должен подниматься на сервер, а материал для проглатывания, который мы используем, не похож на специальные символы, такие как апострофы, которые, похоже, не подходят. Я предполагаю, что http-серверы, такие как ASCII. В принципе, много времени тратится впустую техниками, которые вручную выливают каждый файл для этих черных персонажей, что вызывает много проблем. Кодирование файлов по умолчанию, я думаю, это UTF-8, когда они сгенерированы.Преобразование в ASCII с ограниченным блокнотом ++

Заранее благодарен!

+0

Вы хотите, чтобы символы были удалены при изменении кодировок? Учитывая, что это было бы разрушительно для файла (я знаю, что вы этого хотите, но другие люди не могут), я не думаю, что это возможно. Честно говоря, вы можете просто написать быстрый скрипт Python для удаления/замены определенных символов в файлах. – mbomb007

+0

Кроме того, апостроф является символом ASCII. Вы удаляете символы или заменяете их символом ASCII? – mbomb007

+0

Несомненно, некоторые основные powershell должны быть в состоянии, что вам нужно. Но, пожалуйста, проясните проблему. HTTP-серверы обрабатывают полезную нагрузку контента как байты, поэтому, вероятно, это не тот сервер, который имеет проблемы. –

ответ

0

Я предполагаю, что причина, по которой ASCII не указана, заключается в том, что ASCII не поддерживает все байтовые значения. ASCII имеет только байты 0x00 - 0x7F. UTF-8 является «супер-набором» ASCII, поскольку первые 128 байтов одинаковы, но он также поддерживает 0x80 - 0xFF.

See UTF-8 codepage layout

В принципе, если есть какая-то причина, что вы не можете использовать UTF-8 (как вы собираетесь использовать его для программы, которая поддерживает ASCII только, как вы не хотите каких-либо байтов 0x80 - 0xFF), просто используйте UTF-8 и убедитесь, что эти байты не содержатся в вашей программе.

Обратите внимание, что по той же причине, что указано выше, вы также можете использовать ANSI, который также является супер-набором ASCII. See this SO explanation.

+0

Все символы в формате XML являются Unicode. Я уверен, что он ссылается на кодировку документа, которая может быть ASCII и по-прежнему поддерживает полный набор символов Unicode из-за ссылок на числовые символы XML. (Например, [& # x1f596;] (http://www.fileformat.info/info/unicode/char/1f596/index.htm). Но да, не поддерживая UTF-8, система или процесс имеют некоторые серьезные проблемы –

+0

@TomBlodget Он сказал, что использует Notepad ++, поэтому я говорил о кодировках. Честно говоря, вопрос должен быть помечен [notepad ++]. Я добавлю тег. – mbomb007

+0

Спасибо за объяснение! –