Я использую функции xpath pugixml для поиска определенных узлов в html-документе (загружаемом через curl).pugixml xpath - node not found
Я использую:
pugi::xml_document doc;
doc.load_buffer(htmlcontent.c_str(), htmlcontent.size());
pugi::xpath_node example= doc.select_single_node("//h2[@class='tv_header']");
std::cout << example.node();
, который возвращает 0 узлов. Я знаю, что этот узел существует в документе. Я поставил только этот узел внутри строки и нашел узел успешно. Почему узел не найден в документе? Есть ли проблема с кодировкой html-документа?
Спасибо!
Ах спасибо. Я использовал Tidy HTML (кошмар для настройки), и теперь он отлично разбирается. – user3083672