2011-01-04 2 views
4

У меня довольно любопытная проблема с использованием метода загрузки XElement для загрузки в html-документе (который хорошо сформирован с помощью HTML Tidy), который отлично работает для английских документов, однако перемещение на французские и испанские документы. Мне представлено исключение XML;XElement не загружает файл с акцентированными символами

XML Exception 
Invalid character in the given encoding. Line 23, position 43. 

Метод вызова

XElement doc = XElement.Load("example1.html", LoadOptions.None); 

Sniplet из HTML документа

<font face="Arial" size="3" color="#ffffff"> 
Le test <b> exemple français, qui devrait éventuellement être suivie d'un texte en langue espagnole. </ b> 
</font> 

Я понимаю, что мои HTML не имеет тип кодировки, установленный в начале файла, есть путь вокруг этого?

ответ

3

, потому что вы не используете XDocument вы не можете установить кодировку, использовать вместо и установить кодировку = UTF-8

http://msdn.microsoft.com/en-us/library/bb387063.aspx

+1

Спасибо за указание мне в правильном направлении, в конце концов, после копания вокруг я нашел это также; http://stackoverflow.com/questions/310669/why-does-c-xmldocument-loadxmlstring-fail-when-an-xml-header-is-included – wonea

+0

Добро пожаловать. –