2013-02-28 3 views
0

Я пытаюсь загрузить кусок HTML в DOMDocument MSXML. Указанный кусок является действительным XML с одним исключением - он имеет   объектов. MSXML дросселирует на них, утверждает «Ссылка на неопределенный объект» nbsp. ».Анализ фрагмента HTML с помощью nbsp в MSXML

Могу ли я заставить MSXML признать его действительным каким-то образом?

ответ

1

Простое решение: просто запустите текстовую замену «& nbsp;»; до "" перед разбором документа. Что должно работать, так как не может быть дословных & nbsp; в тексте, который не следует заменять.

Более стандартное решение: объявить nbsp; объекта в xml, вставив

<!DOCTYPE foobar [ 
    <!ENTITY nbsp " " > 
]> 

до корневого узла xml.

Вы также можете использовать «0xA0» и & # x00A0; если вы действительно хотите неразрывное пространство вместо обычного пространства

+0

Закончено с первым вариантом. Ну что ж. Я надеялся, что можно загрузить эти файлы, не изменяя их - не думаю. –