У меня есть программа-загрузчик, которая загружает страницы из Интернета. Кодирование каждой страницы отличается, некоторые из них находятся в UTF-8, а некоторые из них - Unicode. Например: a
, который показывает символ 'a'; страниц, заполненных этими символами. Мы должны преобразовать эти кодировки в обычный текст.Как преобразовать UTF-8 в текст в объекте HTML?
Я использовал класс UnicodeEncoding
в C#, но они мне не помогают.
Как я могу декодировать эти кодировки реальным персонажам? Есть ли класс или метод, которые преобразуют это?
Спасибо.
В стороне: нет ничего похожего на «обычный текст» без кодирования. Очень рекомендуется: http://www.joelonsoftware.com/articles/Unicode.html – Alex
Дорогой, Кенни, пожалуйста, сделайте домашнее задание и исправьте название вопроса - UTF8 является одним из нескольких способов кодирования Unicode. Также это не так, как обычный текст - возможно, вы хотели сказать ANSI или ASCII. В этом случае это невозможно без потери данных. – sorin