Я пытаюсь прочитать Word Doc на C#, а затем отобразить результат в текстовом поле. Но я не хочу читать только текст, но вместо этого прочитал весь файл, включая специальные символы. Мне нужно, чтобы он точно соответствовал результатам, показанным при открытии того же файла в «Блокноте».Как читать Word Doc на C#, чтобы он отображался так, как будто он был открыт в Notepad
Я достиг самых близких результатов с помощью StreamReader. Обратите внимание, что для отображения любых результатов у вас есть follow the instructions in this link. Однако результат по-прежнему не соответствует 100% - некоторые из символов интерпретируются (?) Иначе, чем если бы я открыл Doc непосредственно в «Блокноте». Любые мысли о том, как подойти к этому?
может зависеть от enconding текста: http://msdn.microsoft.com/en-us/library/system.text. encoding.aspx например: Encoding.ASCII.GetString (текст); используя пример из вашей ссылки. –
Какие символы различны? –
Например, Блокнот выводит символы Unicode 255 (вид «y» с точками выше), 208 (выглядит как символ Евро) и 207 (?); в то время как StreamReader показывает Unicode 65533, который является заменяющим символом. – bigcat42