написать простую программу для извлечения всех почтовых адресов из большого текстового файла, имеющего проблему, поскольку некоторые из адресов используют non -стандартные символы.Convert = 00 форматированные коды UTF в текстовом файле с правильным символом utf в vb.net
Это некоторый исходный текст из файла мне нужно обработать:
Руа Вале-де-Louro, N = BA 97 Bloco 2, 1 = Б.А.
, но ей нужно прочитать:
Руа Вале-де-Louro, Nº 97 Bloco 2, 1º
Теперь, очевидно, я мог бы сделать простую замену для этого символов, но мне нужно работать с каждым символом.
BA - это шестнадцатеричное значение символа º в utf32 (хотя и с загрузкой нулей, предшествующих ему), поэтому, если я могу что-то закодировать, чтобы найти все эти экземпляры «= xx» в строке и заменить их правильным utf характер, который разрешил бы его. но для жизни я не могу понять, как это сделать.
Может ли кто-нибудь помочь?
Благодаря
Верование в «обычный текст» ⇒ [Программирование совпадением] (https://pragprog.com/the-pragmatic-programmer/extracts/coincidence). –
Здесь используются два кодировки. Первоначальный текст был, вероятно, с использованием кодовой страницы Windows 1252, а затем преобразован в кодируемый кадром кодировщик. Отправьте его обратно, вы не хотите этого. –